文字認識技術は、音声認識技術と共にひとに優しいマルチメディア情報化社会の実現に重要な役割を担っており、国内外で盛んに研究が行われている。本研究では、知識主導型モデルを用いた次世代文書認識システムを提案し実現する。具体的には、切出し技術、認識技術、知識処理技術の開発を行い、知識処理を中心に据えた高精度な文書認識システムを構築する。平成11年度では、以下のように研究を進め、所望の成果が得られている。 ・システム全体の設計を行う。具体的には、システムが所望の認識精度および認識速度を保証するための各処理部の仕様を検討し決定した。また、文書認識システムとして実用化する場合のユーザーインターフェースの設計を行った。 ・開発の第1歩として標準パターンを作成するためのサンプル収集を行った。収集の対象字種をJIS第一水準漢字(2965字種)、平仮名、片仮名、アルファベットとした。複数のフォントに対し、字種ごとに1サンプルを収集した。 ・1サンプルずつ収集されたサンプルに対し、高精度な標準パターンを作成した。具体的には、フォントが同じであっても、宇の大きさ、コピー回数、プリンタの種類によって、字体が違ってくるため、ここでは、細線化あるいは太線化の手法を適用し、1つの字体から複数のサンプルを自動的に生成した。また、文字のストロークを抽出して、その相対位置を変化させることにより、プリンタによる違いを吸収した。作成後、実際に使用して認識精度の検証を行った。検証に基づき、パラメータの変更を行い、最適値を導出した。
|