大規模なデータで、繰り返しの処理が多くなると、Rでデータ解析するのがつらい。自然と並列処理を導入したくなる。
並列処理のやり方は、snowとかparalellとかforeachとかfurrrとか色々あるけど、furrrでええですわ。tidyverse系なんで学習コスト低いし。
purrr + futureで並列処理するfurrr。
furrrを使おうとしたら、purrrのmapの理解がいるんで、これも勉強。
ほかにも並列処理で役立った情報をまとめとこっと
foreachとparallelの簡単なチュートリアル
foreachとparalell使って、回帰分析のシミュレーションを回した記事
あんま読んでないけど詳しそうなので。
めちゃデカデータを扱いたくなったら。まだ使ったことないけど。