研究課題/領域番号 |
10558056
|
研究機関 | 九州大学 |
研究代表者 |
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
研究分担者 |
福田 亮治 大分大学, 工学部, 助教授 (70238492)
江島 俊明 九州工業大学, 情報工学部, 教授 (00124553)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
立川 道義 株式会社リコー, ソフトウェア所・第2研究室, 研究室長
|
キーワード | 文字認識 / 数式認識 / 文書理解 / 電子図書 / 数学記号認識 |
研究概要 |
数式を含む科学技術文書の光学読み取りについて、本年度は 1.数学記号認識の精度向上 2.文字の誤認識や印刷書体の違いに強い数式認識手法 3.認識・修正・保存の全過程を行える統合システムの試作 を重点的に研究した。1.については、従来用いていた濃度分布特徴量、ペリフェラル特徴量に加えて、新たに境界線方向線素特徴量を加え、3つの特徴量による認識結果の上位候補の順位付き投票によって認識結果を得る手法を導入して、認識率を大きく改善することが出来た。メッシュを粗く取ることにより、比較的少ない学習パターンで、数学記号に対する高い認識率を得ることが出来た点が主要な成果である。2.については、数式認識の従来手法では印刷の書体に依存する手法であったため、この点を改善することと、記号の誤認識が全体の数式認識に与える影響の少ない手法の開発を前年度に引き続き行った。曖昧さを残した形のコスト付き文字配置関係ネットワークから最小コスト全域木を求める事によって数式構造を認識する、従来にない手法である。ネットワークから数式構文としての矛盾のない全域木を上位から一定個数抽出し、最後に各全域木に対して全体構造から定まる大域的なコストにより再評価して、最終結果を返すことにしたため、文字の誤認識や大きさの異なる類似文字による影響が非常に小さく、安定した数式構造解析結果が得られるようになった。3.については、認識結果を原画像表示と対応させながら確認・修正していくユーザーインターフェースを作成し、最終結果をLaTeXとMathMLの2種類の形式で出力する統合システムを構築した。
|