研究概要 |
パターン認識の前処理としての次元圧縮を想定した場合,汎用の次元圧縮法として従来から広く使われている主成分分析では,訓練データに付与されているクラス情報を活用できないという欠点がある.一方,クラス情報を利用する手法として線形判別分析も広く使われているが,圧縮後の特徴量の次元数がクラス数未満に制限されるため,過度の圧縮となってしまい,適当な圧縮結果が得にくいという欠点がある.これらの間題の克服を目指して,圧縮後のクラス分布の相違を指針とする圧縮法を提案た.分布の相違はカルバックライブラー情報量を用いて測り,その計算は,各クラスの分布を平均と分散が等しい正規分布で近似することで行なう.本手法では,与えられた圧縮行列の良否を上記の指針で判断することとし,最適な圧縮行列を逐次計算により求める.これにより、訓練データのクラス情報を有効に活用しつつ,圧縮後の特徴量の次元数に制限のない次元圧縮が実現された.基礎的な実験課題で検証を行い,線形分離不可能な課題等で、主成分分析や線形判別分析よりも適切な次元圧縮に成功し判別率が向上することを確認した. また,クラス情報が複合ラベルの形で与えられる学習問題に関して,ニューラルネットを用いた情報表現および条件つき分布を用いた情報表現を考案し,検討した.
|