知っていることだけ

勉強していて役に立つ、理解の助けになるようなポイントを書いていきます。

Kaggle

Kaggleで使う構文 カテゴリ変数への対処

使用した構文 数値になっているものを文字列に変換 ダミー変数を作成 順序尺度データに対し0, 1, 2...といったデータに変える 使用した構文 数値になっているものを文字列に変換 <DataFrame>.astype(str) ダミー変数を作成 pd.get_dummies(<DataFrame>) 順序尺度データに対し0, 1, </dataframe></dataframe>…

Kaggleで使う構文 データの変換

使用する構文 列にアクセス log変換. trainとtestデータを結合 indexのreset importしたもの import numpy as np import pandas as pd 使用する構文 列にアクセス <DataFrame>["列名"] 又は <DataFrame>.列名 log変換. log1p:全ての値に+1してからlogすることで0に対応する np.log1</dataframe></dataframe>…

Kaggle House Prices 日本語訳カーネル

参考にする構文はこちら protoidea.hatenablog.com protoidea.hatenablog.com 作成したカーネルはこちら. Comprehensive data exploration with Python | Kaggle を元にしています

Kaggleで使う構文 欠損データへの処理

使用する構文 データが欠損しているかを調べる pandas並び替え NAを埋める グループ毎に別の値を埋める 各値が何個あるか 最頻値の取得 使用する構文 データが欠損しているかを調べる <DataFrame>.isnull() データが無いマスにTrue,あるマスにFalseが入ったデータフレー</dataframe>…

Kaggleで使う構文 データの様子を探る

使用した構文 列名を羅列 describe ヒストグラムと推定される確率分布関数を表示 Dataframeの結合 散布図 箱ひげ図 相関行列の取得 ヒートマップ dataframeのうち値が大きいものをn行取得 行名取得 数値データのみの列名を取得 importしたもの import pandas…