2000 Fiscal Year Annual Research Report
科学技術文献データベース化のための高精度数式認識手法の研究
Project/Area Number |
12680411
|
Research Institution | Shinshu University |
Principal Investigator |
岡本 正行 信州大学, 工学部, 教授 (50109196)
|
Keywords | 数式認識 / 文書画像処理 / 文字認識 / パターン認識 |
Research Abstract |
これまで当研究室で開発を行ってきた数式認識システムについて、以下の点で検討を行ない,新たなシステムを作成し実験中である. (1)認識対象となる数式記号・文字フォントの充実 (2)記号・文字同士の接触、切れをより高精度に処理するためのアルゴリズムの改良 (3)広範囲の行列形式表記の認識 (4)上つき、下つき等の添字式認識精度の高度化 上記(1)については,現在共同研究を行っているドイツ、エッセン大学の数学文献のディジタル化プロジェクトで読み取り対象としている文献Archiv der Mathematik vol.60-65から数式記号,特殊フォント等を採取,追加し認識用辞書を構築した.(2)については新たなアルゴリズムを考案しインプリメントしたが,性能が十分でなく今後も検討を続けていく.(3)については,要素として行列や省略記号を含むものも一部認識可能になっている.また(4)については,これまで誤認識を起こしていた長い添字式や極端に小さなサイズの添字式の認識精度に向上が見られた.本研究を進めるに当たっては,平成12年8月に共同研究者であるMichler教授の研究室を訪問し討論,資料収集を行うとともに,10月には彼の研究グループの1人が当研究室に約1ヶ月滞在し共同作業を行った.またこちらでの研究成果である数式認識エンジンは変更がある毎にMichler教授のグループに送り、上記文献の読み取り実験に反映させている。さらに平成13年2月には,九州大学で行われた「数式認識及び関連する科学情報処理に関する研究集会」で上記研究成果を発表し,国内の数式認識関連研究者と討論を行い,今後の研究指針について見直しを行っている.本年度の成果は平成13年9月にアメリカ,シアトルで開催されるInternational Conference on Document Analysis and Recognitionで発表するため,現在論文を投稿中である.
|
Research Products
(2 results)