本研究では、多重型部分空間法を提案し、個性的な字に対しても認識可能な高精度手書き文字認識アルゴリズムを開発する。 当初の研究計画・方法に従って研究を進めた結果、以下の成果が得られた。 1.部分空間の多重化によって生成される各部分空間が筆者の個性を反映するため、まず癖字を含むサンプル(ETL9B)を対象に字種ごとに文字の個性を分類する。分類の方法として、各文字の類似度(文字特徴ベクトル間の距離)を用いてグループ分けを行った。これによって同一癖(例えばある人は文字の横線分を右上上がりに書くなど)のサンプルがグループ単位で分類することが可能になった。各字種につき、いくつのグループに分類すべきかは、グループ内分散(クラスタ内分散)とグループ間分散(クラスタ間分散)に基づき決定した。 2.上記のようにグループ分けを行った後、各グループ単位で部分空間を構築するプログラムを開発した。具体的には、各グループに対し、文字の特徴ベクトルから固有値と固有ベクトルのペアを計算し、そのグループの特徴が最大に反映できる個数を実験的に決定した。これによって、字種単位で様々な個性(癖)を表現できる標準パターン(複数個)を作成できた。平成10年度では、作成された標準パターンを用いて認識実験を行い、高精度な認識システムの実現を目指す。
|