研究概要 |
パターン認識の前処理としての次元圧縮を想定した場合,汎用の次元圧縮法として従来から広く使われている主成分分析では,訓練データに付与されているクラス情報を活用できないという欠点がある.一方,クラス情報を利用する手法として線形判別分析も広く使われているが,圧縮後の特徴量の次元数がクラス数未満に制限されるため,過度の圧縮となってしまい,適当な圧縮結果が得にくいという欠点がある.本研究では,これらの問題の克服を目指して,圧縮後のクラス分布の相違を指針とする圧縮法を考察している. 本年度は,昨年度のカルバックライブラー情報量を用いる手法から,二つの方向へ改良を図った.一つは,利点を保ちつつ欠点を改善する方向であり,片方のクラスだけを白色化するような線形変換を全体に施した上で主成分分析を行うという手法を考案した.この手法は,昨年度の手法と同様の効果を保ちつつ,欠点を改善したものとなっている.即ち,線形分離不可能な課題等で主成分分析や線形判別分析よりも適切な次元圧縮を達成でき,しかも,くり返し計算は不要である.もう一つは、利点をより強化する方向であり,分布を近似せず異クラスデータ間の全組合せについて仮想的なポテンシャルを算出し,その合計を小さくするという指針で次元圧縮を決定する手法を考案した.この手法は,計算量が大きいという弱点を持つが,上の手法で対処できない課題でも適切な結果が得られると期待される. また、クラス情報が複合ラベルの形で与えられる学習問題に関して考案した条件つき分布を用いた情報表現を,二重ラベルから多重ラベルへと拡張した.
|