手書き文字認識システムは、音声認識システムと共に、ひとにやさしいマルチメディア情報化社会の実現に重要な役割を担っており、その基礎となる手書き文字認識手法に関わる研究は国内外で盛んに行われている。日本語を対象とする手書き文字認識では、取り扱うべき字種の多様性と筆者の個性が強く影響し、高精度な認識システムを実現する障害となっている。本研究では、新しい距離尺度として、重み付き固有値距離を提案し、手書き文字認識システムの更なる性能向上を図る。最終的な目標として、認識精度を99.9%(ETL9Bベース)を目指す。平成11年度では、当初の研究計画通りに研究を進め、以下の研究成果を得ている。 ・重み付き固有値距離について検討を行った。まず、これまでの認識の中で、誤認識の多かった類似文字のグループ分けを行った。具体的には、データベースETL9Bを対象に字種ごとに文字の個性を分類した。分類の方法として、各文字の類似度(文字特徴ベクトル間の距離)を用いてグループ分けを行った。これによって類似文字のサンプルがグルーピングされた。グループの形成はグループ内分散(クラスタ内分散)とグループ間分散(クラスタ間分散)を用いて実験的に決定した。 ・グループ分けを行うと、複数の字種を含むグループが生成された。ここでは、これらのグループに対し、重み係数を決定するプログラムを開発した。具体的には、各グループに対し、文字の特徴ベクトルから固有値と固有ベクトルのペアを計算し、そのグループの特徴が最大に反映できる重み係数を学習によって決定した。これによって、グループ単位で表現できる標準パターンが作成された。
|