2022-05-01から1ヶ月間の記事一覧

Performanceについて

Assessment of Regression Models Performance • performance glmやglmerのR2、多重共線性、正規性、過分散、ゼロ過剰を確認する (easystats) - Qiita

Apache Arrowについて

【R】Apache Arrowとduckdbを試してみる - Qiita Apache Spark 3.0でサポートされるRのI/Oのベクトル化 - Qiita Apache Arrowの現状確認(2018年7月) - Technically, technophobic.

行方向で集計したいとき

R

行方向で集計したいとき、例えば総和を求めたいとき、いつもrowwiseとかc_acrossとかの書き方を忘れる。イライラ! `mutate(rowMeans())` や `mutate(rowSums())` で十分 dplyr.tidyverse.org

特定の文字の前後で分割したいとき

str_split_fixed(data$分割したい列, '分割の目印となる文字列', n = 分割後の列数)

欠損値の削除方法について

NAをすべて置き換えたいとき data[is.na(data)] <- 置き換えたいもの

回帰診断について

線形回帰モデルを組んだ時はちゃんと回帰診断して、誤差に関する複数の仮定が妥当かをチェックせなあかんで、という話。 www.goodnalife.com http://www.aoni.waseda.jp/abek/document/regression-3.html www.qualtrics.com

gitについて

git

gitむずすぎワロタなんだが。リモートの全ブランチをローカルに落としたいときは、 git fetch -- all git pull --all でええらしい。しかし、git branchでみてみても、リモートのブランチがローカルで確認できない。git branch -rだと確認できる。よくわから…

接触するポリゴンを1つのポリゴンとしてまとめるとき

R GIS

gisをしていると、接触するポリゴンを1つのポリゴンとしてまとめたいときがある。sfパッケージでできるのだが、どうも思ったようにはいまのところ動かないときがある。 例えば、geom_sfで可視化したときに、接触していないようなポリゴンが接触したと判定さ…