文字列処理

列名を綺麗にしたいとき

janitor::clean_names という関数がとても便利。 列名はすべて小文字に変更 列名はすべてスネークケースに変更 列名に含まれる空白は _ に置換 列名に含まれる邪魔な文字は削除(例:ウムラウト、 @ 、 () など) 列名に含まれる % は percent に変更 列名が…

特定の文字の前後で分割したいとき

str_split_fixed(data$分割したい列, '分割の目印となる文字列', n = 分割後の列数)

欠損値の削除方法について

NAをすべて置き換えたいとき data[is.na(data)] <- 置き換えたいもの

変数名の一括変換

・特定の文字列をもつ変数のみに、特定の変数名の変換処理を適用したいとき rename_at(.vars = vars(contains(特定の文字列), .funs = (変換処理))

stringrについて

半角全角の変換で便利 https://qiita.com/swathci/items/1ca9177e0c24c8dc1355#%E5%8D%8A%E8%A7%92%E5%85%A8%E8%A7%92 漢字ひらがなカタカナ Rで解析:文字列操作の決定版!「stringr」パッケージ 変数名を全部大文字にしたい rename_all(toupper) 数字とそ…