2000 Fiscal Year Annual Research Report
科学技術文書の為のOCR(光学文字読み取り)システムの開発研究
Project/Area Number |
10558056
|
Research Institution | Kyushu University |
Principal Investigator |
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
Co-Investigator(Kenkyū-buntansha) |
福田 亮治 大分大学, 工学部, 助教授 (70238492)
江島 俊明 九州工業大学, 情報工学部, 教授 (00124553)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
立川 道義 株式会社リコー, ソフトウェア所・第2研究室, 研究室長
|
Keywords | 文字認識 / 数式認識 / 文書理解 / 電子図書 / 数学記号認識 |
Research Abstract |
数式を含む科学技術文書の光学読み取りについて、本年度は 1.数学記号認識の精度向上 2.文字の誤認識や印刷書体の違いに強い数式認識手法 3.認識・修正・保存の全過程を行える統合システムの試作 を重点的に研究した。1.については、従来用いていた濃度分布特徴量、ペリフェラル特徴量に加えて、新たに境界線方向線素特徴量を加え、3つの特徴量による認識結果の上位候補の順位付き投票によって認識結果を得る手法を導入して、認識率を大きく改善することが出来た。メッシュを粗く取ることにより、比較的少ない学習パターンで、数学記号に対する高い認識率を得ることが出来た点が主要な成果である。2.については、数式認識の従来手法では印刷の書体に依存する手法であったため、この点を改善することと、記号の誤認識が全体の数式認識に与える影響の少ない手法の開発を前年度に引き続き行った。曖昧さを残した形のコスト付き文字配置関係ネットワークから最小コスト全域木を求める事によって数式構造を認識する、従来にない手法である。ネットワークから数式構文としての矛盾のない全域木を上位から一定個数抽出し、最後に各全域木に対して全体構造から定まる大域的なコストにより再評価して、最終結果を返すことにしたため、文字の誤認識や大きさの異なる類似文字による影響が非常に小さく、安定した数式構造解析結果が得られるようになった。3.については、認識結果を原画像表示と対応させながら確認・修正していくユーザーインターフェースを作成し、最終結果をLaTeXとMathMLの2種類の形式で出力する統合システムを構築した。
|
-
[Publications] T.Kanahori: "On-Line Recognition of Mathematical Expressions Using Automatic Rewriting Method"Advances in Multimodal Interfaces ICMI2000, Lecture Notes in Computer Science, Springer. 1948. 394-401 (2000)
-
[Publications] R.Fukuda: "Optical Recognition and Braille Transcription of Mathematical Documents"Proceedings of the 7th International Conference on Computers Helping People with Special Needs (ICCHP), Karlsruhe. 711-718 (2000)
-
[Publications] 能隅進一: "絞り込み法による数式文字認識とその日本語/数式領域切りだしへの応用"電子情報通信学会論文誌. j83-DII,No.3. 895-906 (2000)
-
[Publications] 金堀利洋: "可変ブロックパターンによる矩形領域分割を用いた行列の認識"電子情報通信学会技術研究報告. (掲載予定). (2000)
-
[Publications] 江藤裕子: "仮想リンク・ネットワークを用いた数式認識"電子情報通信学会技術研究報告. (掲載予定). (2000)
-
[Publications] 田畑耕一: "2次元ワープを併用したオンライン手書き英数字・数学記号認識"電子情報通信学会技術研究報告. (掲載予定). (2000)