2003 Fiscal Year Annual Research Report
数学文献電子化のための数式認識手法の改良と性能評価
Project/Area Number |
14580446
|
Research Institution | Shinshu University |
Principal Investigator |
岡本 正行 信州大学, 工学部, 教授 (50109196)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
Keywords | 数式認識 / 文書画像処理 / 文字認識 / パターン認識 |
Research Abstract |
これまで研究を行ってきた数式認識手法について、以下の点でさらに検討を行なった。 (1)記号・文字同士の接触を切り離すためのアルゴリズムの改良 (2)数式認識精度の向上と性能評価 (3)数学文献中の引用文献の解析と認識 項目(1)については研究代表者の岡本と分担者の鈴木が独自に検討を行ない、これまでのアルゴリズムの改良を行った。この結果、岡本の開発した新手法では、記号・文字同士の接触検出と切り離し精度が従来のものに比べかなり向上した。鈴木は同一種類の数学文献中には、類似の接触パターンが繰り返し現われることに注目し、一度の切り離し操作で類似の接触パターンも自動的に切り離す手法を開発した。この成果により、実際に数学文献を電子化する際に必要となる人間による修正作業の大幅な減少をはかることができる。(2)については、岡本が主に担当し、数式認識手法の改良を行った。またその精度向上を定量的に調べるため、認識対象文献を大幅に拡充すると共に、回答データベースとなるGround Truthを作成し、自動的に数式認識精度を計測するツールを作成した。(3)については主に鈴木が担当し、引用文献部分の著者、論文タイトル、文献名(巻・号等を含む)、ページ、発行年等の解析、認識を行う手法を開発した。これらの研究成果は7th International Conference on Document Analysis and Recognition(Edinburgh)他、幾つかの研究会で発表した。
|
Research Products
(3 results)
-
[Publications] A.Nomura: "Detection and Segmentation of Touching Characters in Mathematical Expressions"Proceedings of ICDAR2003. Vol.1. 126-130 (2003)
-
[Publications] T.Kanahori: "Detection of Matrices and Segmentation of Matrix Elements in Scanned Images of Scientific Documents"Proceedings of ICDAR2003. Vol.1. 433-437 (2003)
-
[Publications] 中塚 翼: "数式認識システムについての一考察"「科学情報の自動処理その応用をめぐる諸問題」研究集会資料. 30-33 (2003)