2001 Fiscal Year Annual Research Report
科学技術文献データベース化のための高精度数式認識手法の研究
Project/Area Number |
12680411
|
Research Institution | Shinshu University |
Principal Investigator |
岡本 正行 信州大学, 工学部, 教授 (50109196)
|
Keywords | 数式認識 / 文書画像処理 / 文字認識 / パターン認識 |
Research Abstract |
これまで開発を行ってきた数式認識システムについて、以下の点で検討を行ない,新たなシステムを構築し性能評価実験をおこなった. (1)行列式、整列式構造認識の高精度化 (2)数式構造認識性能の定量的評価方法 (3)上記(2)のための正答付きデータベース(grand truth)の作成 上記(1)については,昨年開発した手法を基に,より高精度に行列の行,列の要素数を検出するとともに省略記号にも対応できる手法を開発した.また(2)については,認識結果をmathMLで表現し、(3)で作成したデータベースと比較することにより,部分構造式を含む数式認識精度を自動的に算出する手法を開発した.この結果,数式認識アルゴリズムの変更を行ったときは,容易にその効果を確認することができるようになり,これまでの試行錯誤の開発より数段に効率を高めることができた.これらの成果は,共同研究を行っているドイツ,エッセン大学の数学文献のディジタル化プロジェクトで対象としている文献Archiv der Mathematik vol.60-65に対して再度適用し,ほぼ実用に耐えるだけの認識精度が得られることを確認している.これらの成果は,平成13年9月にアメリカ,シアトルで開催された第6回International Conference on Document Analysis and Recognitionで発表した.また平成13年10月には,九州大学で行われた「Workshop on Mathematical Document Recognition and Digitization」では最新の研究成果を発表するとともに,ドイツ,エッセン大学の研究者達及び国内の数式認識関連研究者と討論を行った.また平成14年3月には,共同研究者であるMichler教授,コーネル大学Dennis教授等が主催する数学文献のディジタル化の実用化を図るための国際会議がミシガン大学で予定されており,これまでの研究成果を発表するとともに,今後の研究計画について再度討論する予定である.
|
Research Products
(2 results)
-
[Publications] M. Okamoto, H. Imai, K. Takagi: "Performance Evaluation of a Robust Method for Mathematical Expression Recognition"Proc. of Sixth International Conference on Document Analysis and Recognition. 121-128 (2001)
-
[Publications] M. Okamoto, H. Imai, K. Takagi: "Extension for Matrix Recognition and Performance Evaluation"Report on Workshop on Mathematical Document Recognition and Digitization. (2001)