自己組織化マップとは
・ニューラルネットワークの一種
・教師なしクラスタリング(k-means法に動作が似ている)
・多次元のデータを圧縮して低次元(2次元)にマッピングするもの。(そういう意味では、非線形の主成分分析+クラスター分析とも言える。)
・多次元データを2次元にマッピングできることから、多次元データの可視化にも使われる。
実際に計算するには
・文献などでは、パッケージとして SOM_PAK が有名だが、R(オープンソースの統計処理ソフトウェア)の方が日本語のドキュメントも多く、分かりやすい。
・RでSOM(自己組織化マップ) の関連リンクにある pdf の "Rと自己組織化マップ" というのが分かりやすい。
学習のパラメータについて
以下、コホネン先生著の"自己組織化マップ"より、ものすごくテキトーに抜粋
・単調減少関数は、線形的でも反比例的でも指数的でもさほど問題ではない。
・学習回数は、最低でもユニット数の500倍。
・学習回数はユニットの数に依存し、学習データの数には依存しない。
・半径の初期値は、マップが断片的にならないようにネットワーク全体の直径以上。
・フェーズを2つに分けて学習する場合(マップの断片化を防ぐために)
-最初のフェーズでは、大域的な学習を行う。1000ステップぐらいで α=0.9 など α は 1 に近い値がよい。
-次のフェーズで、微調整を行う。学習回数は長めに設定する必要がある。α は 0.02 より小さな値に達するようにする
・ユニットの初期値が乱数ではなく大まかな入力密度関数に適応した初期値(順序付けられた状態)で開始できる場合、近傍関数が狭く、かつ α=0.2 とか 0.1 のような低い値であっても、学習過程は急速に収束する。
・ニューラルネットワークの一種
・教師なしクラスタリング(k-means法に動作が似ている)
・多次元のデータを圧縮して低次元(2次元)にマッピングするもの。(そういう意味では、非線形の主成分分析+クラスター分析とも言える。)
・多次元データを2次元にマッピングできることから、多次元データの可視化にも使われる。
実際に計算するには
・文献などでは、パッケージとして SOM_PAK が有名だが、R(オープンソースの統計処理ソフトウェア)の方が日本語のドキュメントも多く、分かりやすい。
・RでSOM(自己組織化マップ) の関連リンクにある pdf の "Rと自己組織化マップ" というのが分かりやすい。
学習のパラメータについて
以下、コホネン先生著の"自己組織化マップ"より、ものすごくテキトーに抜粋
・単調減少関数は、線形的でも反比例的でも指数的でもさほど問題ではない。
・学習回数は、最低でもユニット数の500倍。
・学習回数はユニットの数に依存し、学習データの数には依存しない。
・半径の初期値は、マップが断片的にならないようにネットワーク全体の直径以上。
・フェーズを2つに分けて学習する場合(マップの断片化を防ぐために)
-最初のフェーズでは、大域的な学習を行う。1000ステップぐらいで α=0.9 など α は 1 に近い値がよい。
-次のフェーズで、微調整を行う。学習回数は長めに設定する必要がある。α は 0.02 より小さな値に達するようにする
・ユニットの初期値が乱数ではなく大まかな入力密度関数に適応した初期値(順序付けられた状態)で開始できる場合、近傍関数が狭く、かつ α=0.2 とか 0.1 のような低い値であっても、学習過程は急速に収束する。


コメントする