知っていることだけ

勉強していて役に立つ、理解の助けになるようなポイントを書いていきます。

Kaggleで使う構文 カテゴリ変数への対処

使用した構文

数値になっているものを文字列に変換

<DataFrame>.astype(str)

ダミー変数を作成

pd.get_dummies(<DataFrame>)

順序尺度データに対し0, 1, 2...といったデータに変える

from sklearn.preprocessing import LabelEncoder
エンコーダにつける名前 = LabelEncoder().fit(<値>)
結果 = エンコーダにつける名前.transform(<値>)