研究概要 |
データ集合の分布に基づいた非線形距離測度を定義するために, データ集合をグラフで表現し, それを自己組織化マップの学習アルゴリズムに組み込んだ. さらに, 各データ点周りにエネルギー関数を考え, データ集合全体のエネルギー関数に基づくグラフ生成手法を開発した. これにより, 計算コストの削減のみならず, 上記手法のグラフ作成時に問題となる不完全グラフ(複数のグラフが構築される場合がある)が解消された. この結果を2008年9月に開催された国際会議WAC2008で報告した. データ分布からグラフを作成する方法は様々提案されているが, データ分布によっては, 不完全グラフになったり, 不必要なリンクを数多く生成したりすることが問題点として挙げられる. 本手法は, それらの問題点を解決可能なものである. また, NMISTの顔画像データベースに提案手法を適用し, 古典的な自己組織化マップと比較し, 良好な分類結果が得られた. これらの成果から, データ集合の高次元空間内に内在する非線形なパラメータ推定が可能であることが示された. また一方で, 学習安定性のためのバッチ処理アルゴリズムも考案した. 現在, 人工データでの検証はほぼ終了し, MNIST顔画像データベースでの検証を行っている. 本バッチアルゴリズムでは, データ集合の重み付き平均を算出する必要があるが, 上記エネルギー関数を利用してそれを実現した. 本バッチアルゴリズムは, 他の非線型マニフォールド学習手法にも適用が可能であると考えられ, 応用範囲は非常に広いものであると考える.
|