研究課題/領域番号 |
10558056
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 展開研究 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 九州大学 |
研究代表者 |
鈴木 昌和 九州大学, 大学院・数理研究院, 教授 (20112302)
|
研究分担者 |
福田 亮治 大分大学, 工学部, 助教授 (70238492)
江島 俊明 九州工業大学, 情報工学部, 教授 (00124553)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
山形 秀明 株式会社リコー, ソフトウェア所・第2研究室, 研究員
立川 道義 株式会社リコー, ソフトウェア所・第2研究室, 研究室長
|
研究期間 (年度) |
1998 – 2001
|
キーワード | 文字認識 / 数式記号認識 / 数式認識 / 文書理解 / 電子図書 |
研究概要 |
この研究は数式を含む文書のスキャナ画像を認識し、科学技術文書の電子化や自動点訳などに応用できるシステムの開発を目指したものである。画像のレベルとしては、比較的鮮明に印刷された文書を400dpi~600dpiでスキャンしたものを認識象とした。 数学記号を認識できる市販の文字認識エンジンは存在しないため、科学技術文書の英数字や記号類の印刷字体の採集を行い、高度な数学記号まで認識する数式用の文字認識エンジンを独自に開発した。複数の特徴量を併用した認識アルゴリズムを用いて、英数字については市販OCRと同程度の認識能力を保ちながら、約450種類の文字・記号の識別が可能な認識エンジンを開発できた。英字の立体・イタリックの識別も高精度で行う。 文章中では文字認識精度を向上させるために単語辞書やbigram, trigramなどの言語情報を用いた補正が有効であり、他方、数式中では別のメカニズムに基づいた誤認識補正が必要となる。そのため、頁画像を行分割後、文章領域と数式領域の分離を行うアルゴリズムを、日本語文書と英語文書に対して開発した。 数式構造解析については、各文字・記号の認識候補文字間を仮想リンクで結んだネットワークを生成し、最小コストの全域木として数式構造解析結果を取得する方法を開発した。ネットワーク構成時の局所的なコストによる上位の数式構文木候補を複数取り出し、最後に大域的な数式としての構造から決まるコストによって再評価することで、大きさの異なる類似文字の誤認識や、印刷書体による記号の大きさの違いなどによる局所的な誤りが全体の構造コストによって自動補正され、安定した結果が得られる手法となった。 また、認識結果を数式も含めて、容易に修正できるユーザー・インターフェースの研究も行い、オンライン・手書き数式入力による数式編集システムを開発した。
|