Research Abstract |
本研究は,解析の対象となるデータが分布している空間の距離構造の学習問題を研究対象とするものである.従来の機械学習手法の多くて採用されている,特徴空間における判別平面とデータとの距離を最大化するというマージン最大化に基づくアプローチに対して,特徴空間におけるデータ分布を最適化することで,目的とする処理に応じて特徴空間における距離構造を学習することを目的とする.特徴空間における距離構造の学習の基準として,申請者はクラス条件付きエントロピー最小化を提案している. 平成22年度は,まず,条件付きエントロピー最小化基準に基づき特徴空間の距離構造を学習する手法を,Multiple Kernel Learningの枠組みで提案し,高精度な判別機を実現した.,さらに,提案した手法を,音声による話者識別という困難なタスクに適用し,既存手法を上回る性能を得た.一方,提案する学習の枠組みの根幹をなす,エントロピーの推定手法と最適化手法の研究も進めた.観測したデータから,そのデータを生成した確率分布のエントロピーを推定する問題は古くから研究されている.我々は,ノンパラメトリックなエントロピー推定手法としてよく知られているk最近傍法を,分位点を用いて再定式化し,観測したデータに重みが与えられている状況でも利用出来るエントロピー推定手法を開発した.時系列解析や重点サンプリングなど,データに重みを考慮すべき局面は多い.我々は,新たに開発したエントロピー推定手法を,1.単一クラス学習例を用いた2クラス判別問題,2.データ分布を保ったデータ圧縮問題,3.アンサンブル学習における学習機の重み最適化問題,4.時系列データの変化点検出問題,といった種々の問題に適用し,有用性を確認した.
|