Kaggle
使用した構文 数値になっているものを文字列に変換 ダミー変数を作成 順序尺度データに対し0, 1, 2...といったデータに変える 使用した構文 数値になっているものを文字列に変換 <DataFrame>.astype(str) ダミー変数を作成 pd.get_dummies(<DataFrame>) 順序尺度データに対し0, 1, </dataframe></dataframe>…
使用する構文 列にアクセス log変換. trainとtestデータを結合 indexのreset importしたもの import numpy as np import pandas as pd 使用する構文 列にアクセス <DataFrame>["列名"] 又は <DataFrame>.列名 log変換. log1p:全ての値に+1してからlogすることで0に対応する np.log1</dataframe></dataframe>…
参考にする構文はこちら protoidea.hatenablog.com protoidea.hatenablog.com 作成したカーネルはこちら. Comprehensive data exploration with Python | Kaggle を元にしています
使用する構文 データが欠損しているかを調べる pandas並び替え NAを埋める グループ毎に別の値を埋める 各値が何個あるか 最頻値の取得 使用する構文 データが欠損しているかを調べる <DataFrame>.isnull() データが無いマスにTrue,あるマスにFalseが入ったデータフレー</dataframe>…
使用した構文 列名を羅列 describe ヒストグラムと推定される確率分布関数を表示 Dataframeの結合 散布図 箱ひげ図 相関行列の取得 ヒートマップ dataframeのうち値が大きいものをn行取得 行名取得 数値データのみの列名を取得 importしたもの import pandas…