1998 Fiscal Year Annual Research Report
排他的学習ネットを用いた悪筆文字認識の高精度化に関する研究
Project/Area Number |
10780254
|
Research Institution | Yamagata University |
Principal Investigator |
猿田 和樹 山形大学, 人文学部, 講師 (80282193)
|
Keywords | 文字認識 / ニューラルネットワーク / 悪筆文字 / 類似文字 |
Research Abstract |
本研究は、これまで提案してきたニューラルネットワーク(ELNET-II)を基盤とし、多様な字形に対応可能な認識アルゴリズムを開発することを目的としている。 まず第一段階として、手書き文字データベースETL913(枠あり)、IPTP2(枠なし郵便宛名)内の画像から、悪筆(くずれ字、かすれ字、つぶれ字)を抽出し、ELNET-IIと人間の文字認識能力を比較検討した。誤認識と悪筆との関係を解析するためである。全般的に人間の方がはるかに優れた認識結果を示したが、太字で文字の部分がつぶれているような文字パターンについては、人間もELNET-IIも低い認識率しか得られなかった。これは概形特徴をとらえても、示差的特徴を抽出するのが困難であるためと考えられる。一方、郵便宛名から採集したくずれの多い文字については、ELNET-IIが40%以下の認識率であったのに対し、人間は95%以上の認識率を示した。これにより局所的な変動への対応能力の差が認識精度に大きく影響を与えていることが明らかとなった。また、人間が文字認識に利用する特徴は、その変形や歪みにたいして非常に頑健であることも分かった。一方、ELNET-IIでは局所的あるいは概形的な変動への対応能力が著しく劣っていることが示された。ただし、つぶれ字やかすれ字に対しては、人間でもそれほど高い認識精度が得られないことから、ELNET-IIでも今後大きな向上は期待できないと言える。 次にELNET-IIによる文字認識シミュレータを作成した。シミュレータを用いることにより悪筆の生成と認識、局所的な文字ストローク変動の度合と影響の大きさ等について実験的検討を行うことが可能である。これについては現在実験中であり、今のところ大きな知見は得られていない。今後、さらに局所的な特徴を考慮した認識や部分空間法との対応について理論的・実験的に研究を重ねる予定である。
|