研究概要 |
本研究では,低品質な類似文字をより高精度に類別するための手法として,一般化線形判別法と非線形変換とを組み合せた手法について検討を行なった.これまでの代表的な文字認識手法の1つとして,文字画像から方向線素特徴量と呼ばれるある種の特徴を抽出し,その特徴を用いて識別を行う方法がある.方向線素特徴量は196個の数字で表されているため,196次元空間の1点としてとらえることができるが,従来から提案されてきた類似文字識別の根本的な考え方は,類似する2種類の文字の違いが最も良く現れる部分空間にこれらの点を射影し,この部分空間に2つの類似文字の境界面を設定して判別を行なおうというものである.この手法を用いれば,比較的少ない計算量でより高精度な識別が実現可能であるが,射影そのものの性質から来る識別能力の限界があることがわかっている.そこで,一般化線形判別法による類似文字識別において,どのような性質を持つ非線形変換が有効であるかを明らかにし,その非線形変換を用いた類別を実現するために,どのような手法によって計算量の大幅な削減を実現するか,について検討した.その結果,正準化によって得られる変量の中で固有値の小さなもののうち,互いに独立生の低い変量の積によって表現される相関項が高次元の非線形変換に有効であり,そのような相関項によって作られる非線形部分空間の中で類似文字判別のための決定境界面を設定することにより,より計算量をおさえ,精度の高い識別が可能となることがわかった.
|