知っていることだけ

勉強していて役に立つ、理解の助けになるようなポイントを書いていきます。

機械学習

pythonで機械学習 初心者向け PCのカメラを使いリアルタイム処理

対象読者 概要 機械学習 使った関数 import したもの カメラ取得 カメラ破棄 カメラの画像取得 新規ウィンドウに画像を取得 ウィンドウ破棄 キーボード入力を取得 画像の差分の絶対値を取得 輪郭抽出 参考書籍 対象読者 pythonで機械学習を試してみたい PCカ…

pythonで機械学習 初心者向け 輪郭抽出

対象読者 前準備 機械学習 使った関数 importしたもの グレースケールにする. グレースケール画像の表示 画像を平滑化(白色雑音の除去) 二値化 輪郭抽出 外接矩形を作成 長方形を図示 参考書籍 対象読者 pythonで機械学習を試してみたい 領域抽出を簡単にや…

pythonで機械学習 初心者向け 顔認識でモザイクをかける

対象読者 概要 前準備 使用プログラム 参考図書 対象読者 pythonで機械学習がやりたい 簡単な画像認識がやりたい 概要 cascadeファイルから人の顔を自動認識。 認識した部分を縮小、拡大することでモザイク風にする。 前準備 cascadeファイルをopencv/haarca…

pythonで機械学習 初心者向け 明日の平均気温を予測する

対象読者 前準備 機械学習 参考書籍 対象読者 pythonで機械学習を試してみたい 日常に役立ちそうな具体例で機械学習をやってみたい 前準備 気温データを 気象庁|過去の気象データ・ダウンロード から取得。 今回は2009/1/1から2018/12/31までの、東京での平…

Kaggleで使う構文 カテゴリ変数への対処

使用した構文 数値になっているものを文字列に変換 ダミー変数を作成 順序尺度データに対し0, 1, 2...といったデータに変える 使用した構文 数値になっているものを文字列に変換 <DataFrame>.astype(str) ダミー変数を作成 pd.get_dummies(<DataFrame>) 順序尺度データに対し0, 1, </dataframe></dataframe>…

Kaggleで使う構文 データの変換

使用する構文 列にアクセス log変換. trainとtestデータを結合 indexのreset importしたもの import numpy as np import pandas as pd 使用する構文 列にアクセス <DataFrame>["列名"] 又は <DataFrame>.列名 log変換. log1p:全ての値に+1してからlogすることで0に対応する np.log1</dataframe></dataframe>…

Kaggleで使う構文 欠損データへの処理

使用する構文 データが欠損しているかを調べる pandas並び替え NAを埋める グループ毎に別の値を埋める 各値が何個あるか 最頻値の取得 使用する構文 データが欠損しているかを調べる <DataFrame>.isnull() データが無いマスにTrue,あるマスにFalseが入ったデータフレー</dataframe>…

Kaggleで使う構文 データの様子を探る

使用した構文 列名を羅列 describe ヒストグラムと推定される確率分布関数を表示 Dataframeの結合 散布図 箱ひげ図 相関行列の取得 ヒートマップ dataframeのうち値が大きいものをn行取得 行名取得 数値データのみの列名を取得 importしたもの import pandas…

Pythonで動かして学ぶ! あたらしい機械学習の教科書 紹介

この記事は次の読者を対象にしています 紹介 まとめ この本を読むべき人は Pythonで動かして学ぶ! あたらしい機械学習の教科書 作者: 伊藤真 出版社/メーカー: 翔泳社 発売日: 2018/02/15 メディア: Kindle版 この商品を含むブログを見る この記事は次の読…

すぐに使える! 業務で実践できる! Pythonによる AI・機械学習・深層学習アプリのつくり方 紹介

この記事は次の読者を対象にしています 紹介 まとめ この本を読むべき人は すぐに使える! 業務で実践できる! Pythonによる AI・機械学習・深層学習アプリのつくり方 作者: クジラ飛行机,杉山陽一,遠藤俊輔 出版社/メーカー: ソシム 発売日: 2018/06/29 メデ…

アルゴリズムチェーンとパイプライン 「Pythonではじめる機械学習」まとめ

交差検証と処理タイミング 交差検証と処理タイミング テストデータの情報を学習に用いてはならない。交差検証でも同じである。検証データの情報を学習に用いてはならない。つまり、データの前処理(PCAなど)も訓練データと検証データに分けてから行う必要が…

評価基準とスコア 「Pythonではじめる機械学習」まとめ

[Pythonではじめる機械学習-scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎, 2017]の「5.3 評価基準とスコア」 (p270~298)で学んだこと。 指標「精度」の欠点 混同行列(confusion matrix) クラス分類と閾値 適合率-再現率カーブとROCカーブ 適合…