研究概要 |
統計的手法による文字認識手法において,類似するカテゴリをより精度良く分離するための一手法として混合識別法がある.これは,個々の文字から得られる特徴量を高次元空間の1点として表現し,類似する2つの文字カテゴリをある部分空間に射影し判別を行なうものである.本研究では,部分空間の特定に用いる線形射影が,識別精度の限界に大きな影響を及ぼしていることを指摘し,その解決策の調査・研究を通して,一般化線形判別法を応用し2つの類似カテゴリをより精度良く分離できる非線形境界曲面を求める手法を検討した. その結果,2次の統計量を用いた非線形変換では,ある特定の相関項と,ある特定の自乗項の寄与度を高くすることにより,従来の線形射影による部分空間に比べて精度の高い曲面を求めることが可能であることがわかった.実験による調査の結果,これらの相関項および自乗項は,もとの特徴量空間において,2つの類似カテゴリの違いが顕著に現れる戊分から求まる項の一部であることは明らかになったが,それらの項をもとの特徴量空問から推定する手法を確立するまでには至っていないため,現段階では,高次兀空問に対してFisherの線形判別法を適用して境界曲面に寄与度の高い相関項および自乗項を求める必要がある. また,高次統計量を用いた手法についても調査・研究を行った.現段階では,3次および4次の統計量が,2つの類似カテブリの境界曲面を推定するのに有効であることが理諭的にわかっているが,具体的な適用方法および実装については来年度の研究課題である.
|