研究概要 |
本研究は,手書きされた日本語単語を個々の文字に切り出すことなく,一括して認識する方法(ホリスティック法)の認識精度を向上させることを目的としている. 本年度は認識システムの構築と,単語形状の正規化方法およびマッチング方法の組み合わせによる精度向上を試みた.認識システムの構築はほぼ完成し,郵政研究所の手書き文字データベースIPTP CD-ROM2のデータを用いて認識実験が行えるようになった.さらに、このシステムを用いて,単語画像の正規化処理による認識率の変化、マッチング方法による認識率の変化を、様々な組み合わせにより調べた.その結果,正規化法として3つの正規化法(図形間隔の正規化:図形と図形の間隔を一定間隔にする,図形幅の正規化:単語中の各図形の横幅を一定幅にする、および単語大きさの正規化:単語に外接する矩形の大きさを一定の大きさにする)を採用し,マッチングにDPマッチングを採用したときに最も高い認識率が得られることを明らかにした.以上の結果は,情報処理学会論文誌に報告した. なお本方法ではひとつの単語につきひとつの単語辞書を用意する必要がある.現在は2000程度の小規模な単語辞書を用いているが,今後さらに大規模な辞書を用いた場合は,辞書容量およびマッチング回数などが増大することが考えられる.これらの問題に対する対策は今後の課題である.またさらに新しい正規化法およびマッチング法の模索が今後の課題である.
|