主成分分析(PCA)とは、特徴量の次元がバカでかくなりすぎた場合に行われる次元収縮の手法である。
参考: http://www-pse.cheme.kyoto-u.ac.jp/~kano/document/text-PCA.pdf
http://aoki2.si.gunma-u.ac.jp/lecture/PCA/index.html
主成分分析は広く知られている手法で、統計学で習った人も多いかもしれない。
パターン認識の分野では、この主成分分析と組み合わせて、独立成分分析(ICA)がしばしば使われる。
独立成分分析と主成分分析の処理は似ている。だが、主成分分析は(主成分の)軸は直交しなければいけないのに対して、独立成分分析では軸は直交しなくてもよいという点が違う。独立成分分析では、データ分布の独立性を見るのだ。
独立成分分析は fastICA ( http://www.cis.hut.fi/projects/ica/fastica/ ) で簡単に計算できる。
以下では、fastICA の例をもって説明する。
参考: http://www-pse.cheme.kyoto-u.ac.jp/~kano/document/text-PCA.pdf
http://aoki2.si.gunma-u.ac.jp/lecture/PCA/index.html
主成分分析は広く知られている手法で、統計学で習った人も多いかもしれない。
パターン認識の分野では、この主成分分析と組み合わせて、独立成分分析(ICA)がしばしば使われる。
独立成分分析と主成分分析の処理は似ている。だが、主成分分析は(主成分の)軸は直交しなければいけないのに対して、独立成分分析では軸は直交しなくてもよいという点が違う。独立成分分析では、データ分布の独立性を見るのだ。
独立成分分析は fastICA ( http://www.cis.hut.fi/projects/ica/fastica/ ) で簡単に計算できる。
以下では、fastICA の例をもって説明する。
これを元データとして、主成分分析、独立成分分析をしてみる。
これが主成分分析をした結果。
軸は直交しなければいけないという条件があるので、ひし形のまま。
これが独立成分分析をした結果。
軸は直交しなくてもよく、最も独立性がある分布に軸を取ることができる。
このことにより、のちの分類などの処理の識別制度を高めることができるのだ。
ただ、独立成分分析は次元の収縮ができないので、主成分分析と組み合わせて使われることがほとんど。
パターン認識では
特徴量抽出→主成分分析で次元削減→独立成分分析で独立性分析→分類器で学習・分類
っていう感じで使われることが多い。
たぶん。


コメントする