2022-02-01から1ヶ月間の記事一覧

ディレクトリの操作

ディレクトリの基本的な操作コマンド ファイル操作関数 | R によるファイルの作成、削除、移動などについて ディレクトリがなぜか削除できないとき https://skume.net/entry/2021/02/12/230851

stringrについて

半角全角の変換で便利 https://qiita.com/swathci/items/1ca9177e0c24c8dc1355#%E5%8D%8A%E8%A7%92%E5%85%A8%E8%A7%92 漢字ひらがなカタカナ Rで解析:文字列操作の決定版!「stringr」パッケージ 変数名を全部大文字にしたい rename_all(toupper) 数字とそ…

ggplotでよく見る記事

日付データの軸ラベル http://sakananoiroiro.seesaa.net/article/452917978.html 軸ラベルの回転 https://qiita.com/hoxo_m/items/1a0b71b5868686311747 軸の数値を整数スケールにしたい scale_x_continuous(breaks = scales::pretty_breaks()) pdfで日本語…

次元削減について

主成分分析をよく使っていたけど、高次元なデータはスパースすぎて、PCAだとうまくいかないらしい。高次元のときの点間の距離と、次元削減後の低次元のときの点間の距離がうまく対応しないみたい。 んで、tSNEやUMAPはPCAに比べて次元削減がええみたい。tSNE…

距離の近い点を検索する方法

R GIS

distances::nearest_neighbor_search()をつかってみた。引数で、distances::distances()で作った距離行列、検索する近傍点の数、検索する範囲を指定できる。 distances::nearest_neighbor_search( distances = distances::distances(座標データフレーム), k …

ENMevalについて

maxentで使われるRパッケージにENMevalがある。ENMevalのバックエンドにはmaxnetを使われていて、さらにmaxnetのバックエンドにはglmnetが使われている。 ENMevalには正則化に関わるパラメタrm(regularization multipier。maxnetでいうとregmultという引数…

glmnetについて

R

glmnetでの、lasso/ridge/elastic netの変数削減の部分に関わるパラメタlambda。初期設定だと、めちゃ小さいlambdaからめちゃデカいlambdaを200点とってきて、glmnetは全部モデリングしちゃう。んで、どうやって最適なlambdaを決めるかって話だけど、どうも…

gis操作について

R GIS

rstudioでgisを触る機会が増えてきたけど、勉強してはすぐ忘れてしまう。メモ。 raster::rasterFromXYZ(long, lat, value) 緯度経度つきの環境データをラスターに変換するとき使うことあり。 crs関係はここをよく使う JGD座標系とEPSGの一覧表 | OpenなGISの…

Rstudioのこまごました設定

使って便利な機能をまとめておく。 ・改行部分の自動インデント ctrl + Iで選択範囲がきれいにインデントされる。 ・イコールの自動インデント ctrl + oで選択範囲のイコールの位置がきれいにインデントされる。 ショートカットは自分で設定する。僕は改行イ…

並列処理で役立った情報まとめ

大規模なデータで、繰り返しの処理が多くなると、Rでデータ解析するのがつらい。自然と並列処理を導入したくなる。 並列処理のやり方は、snowとかparalellとかforeachとかfurrrとか色々あるけど、furrrでええですわ。tidyverse系なんで学習コスト低いし。 pu…

日頃調べたことをつらつら備忘録として書いていきま~す。 たぶん、統計学、プログラム、生物の勉強内容がメインになりそう。 なんか、日記も併用している研究者もいるし、僕も日記をつけていこうかな。