研究概要 |
次元圧縮 パターン認識の前処理としての次元圧縮を想定した場合,汎用の次元圧縮法として従来から広く使われている主成分分析では,訓練データに付与されているクラス情報を活用できないという欠点がある.一方,クラス情報を利用する手法として線形判別分析も広く使われているが,圧縮後の特徴量の次元数がクラス数未満に制限されるため,過度の圧縮となってしまい,適当な圧縮結果を得にくいという欠点がある.本研究では,これらの問題の克服を目指して,圧縮後のクラス分布の相違を指針とする圧縮法を考察した. まず,分布の相違をカルバックライブラー情報量を用いて測る手法を検討した.これにより,訓練データのクラス情報を有効に活用しつつ,圧縮後の特徴量の次元数に制限のない次元圧縮が実現された.基礎的な実験課題で検証を行い,線形分離不可能な課題等で,主成分分析や線形判別分析よりも適切な次元圧縮に成功し判別率が向上することを確認した.ただし,この手法は各クラスのデータに多次元正規分布をあてはめており,分布の相違を最大化する圧縮法を求めるために反復計算が必要となる.そこで,より簡易な方法として,片方のクラスだけを白色化する線形変換を全体に施した上で主成分分析を行う手法を考案した.これにより,反復計算を必要とせず,前手法と同様の特性を得ることができた.一方,計算量の削減よりも圧縮の適切さを追及する方向では,異クラスデータ間の仮想ポテンシャルを用いる手法を提案し,特に低次元への圧縮において,前手法に勝る判別正答率を得ることができた. 情報表現 また,クラス情報が複合ラベルの形で与えられる学習問題に関して,ニューラルネットを用いた情報表現および条件つき分布を用いた情報表現を考案し,その特性を検討した.
|