知っていることだけ

勉強していて役に立つ、理解の助けになるようなポイントを書いていきます。

パターン認識の全容を分かりやすく

このページは以下の読者を対象にしています

パターン認識とは

入力された画像が、どの概念に属するかを答えること。 例) アルファベットの文字認識:入力文字パターンがA~Zのどれかを推測する。

パターン認識の基本構成

  1. 前処理(preprocessing):ノイズ除去、正規化をして認識をしやすくする。
    (正規化:大きさ、位置、傾きの調整など)
  2. 特徴抽出(feature extraction):入力データのうち、識別に必要な情報のみを抽出する。
    主に特徴ベクトルの形で抽出。機械学習を用いることがある。
    例) 数字の認識なら、線の位置と傾きだけで十分に思える。
  3. 識別処理:特徴ベクトルと識別辞書を照合して、所属パターンを答える。 (識別辞書:この特徴ベクトルを持つものはこのクラス、といったことが書かれてある辞書。)

識別処理で用いる手法

最近傍決定法

クラスタの重心のみを記憶。入力が最も近いクラスタを答える。