統計学

ポアソン過程について

無限長の時間軸を用意 サンプルサイズ n の点を時間軸上にランダム配置 時間軸を有限の長さの区間に分割し、ある区間について考える ある区間内に各点が含まれる確率を p とする 区間内の点の個数が k のとき、 k ~ Bionomial(N, p) となるので、 P(N = k) …

mcmcを使ってベイズ推定を自作でやってみる

ベイズ推定はライブラリやstanを使えばお手軽に実行可能 お手軽すぎて中身が本当に理解できているか不安 なので自作してみた まずは準備 # 神ライブラリ pacman::p_load(tidyverse) # データの格納先 mu <- NULL lp <- NULL # パラメタ更新のステップサイズ …

交絡のコントロールについて

因果推論したいとき、交絡をいかにコントロールするかは大切 交絡のコントロールの方法はたくさんある 層別分析 多変量解析(重回帰分析など) 傾向スコア(マッチング、逆確率重みづけ、など) などなど 交絡が生じているときにコントロールしないとどうな…

Performanceについて

Assessment of Regression Models Performance • performance glmやglmerのR2、多重共線性、正規性、過分散、ゼロ過剰を確認する (easystats) - Qiita

回帰診断について

線形回帰モデルを組んだ時はちゃんと回帰診断して、誤差に関する複数の仮定が妥当かをチェックせなあかんで、という話。 www.goodnalife.com http://www.aoni.waseda.jp/abek/document/regression-3.html www.qualtrics.com

次元削減について

主成分分析をよく使っていたけど、高次元なデータはスパースすぎて、PCAだとうまくいかないらしい。高次元のときの点間の距離と、次元削減後の低次元のときの点間の距離がうまく対応しないみたい。 んで、tSNEやUMAPはPCAに比べて次元削減がええみたい。tSNE…