2003 Fiscal Year Annual Research Report
Project/Area Number |
14380182
|
Research Institution | Kyushu University |
Principal Investigator |
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
Co-Investigator(Kenkyū-buntansha) |
黄瀬 浩一 大阪府立, 工学部, 助教授 (80224939)
内田 誠一 九州大学, システム情報科学研究院, 助教授 (70315125)
岡本 正行 信州大学, 工学部, 教授 (50109196)
藤本 光史 福岡教育大学, 教育学部, 講師 (20270241)
大武 信之 筑波技術短期大学, 教育方法開発センター, 助教授 (10223851)
|
Keywords | 数式認識 / 文字認識 / 科学技術文書電子化 / 電子ジャーナル / 視覚障害者支援 / 行列の認識 |
Research Abstract |
本年度は主として次の課題について研究した。 1.数式中の接触文字や分離文字の認識手法について研究し、全体の認識率向上に関する研究を行った。テキスト領域での接触文字や分離文字の認識は種々の方法が提案されているが、それらは数式領域では使えない。縦・横・斜めに切断候補位置を検索し、文字認識を実行して切断位置や分離文字統合を行う手法と、同一文書中の非接触・非分離文字パターンとマッチングする手法を併用することにより、約7割程度の接触・分離文字の認識が可能になった。実験に際しては、高品質な画像から低品質な画像まで含む大規模且つ正確な正解コード付きデータベース(Ground Truth)を作成しておこなった。また、このデータベースから特徴ベクトルによる篩いによって、文字や記号パターンを重複なく自動抽出システムを開発し、文字・記号画像データベースを作成した。今後、Ground Truthが充実していけば、それに連動して文字認識用の文字・記号画像データベースが自動更新されていくことになり、今後の研究の効率化に大きな寄与することが見込まれる。 2.数学論文の引用文献リストから書誌情報を抽出する手法について、研究を行った。学術文献の電子化が進み、引用文献表から書誌情報を自動抽出し、学術文献データベースへのハイパーリンクを生成することが研究課題の一つとなっている。本研究では、数学論文誌の引用文献の構文解析タグ付きコーパスを作成し、コーパスから生成文法を自動抽出して、引用文献の書誌情報抽出パーサーを構成する手法をとった。未だ、'コーパスの規模が小さいため、解析成功率は十分とは言えないが、来年度の研究でコーパスの拡大と、確率文法の導入で解析成功率の向上を図りたい。 3.数学の文献には数式だけでなく、可換図式と云われる矢印と数式を組み合わせた図式が命題記述や証明の中でよく用いられている。今年度は頁画像からの可換図式の検出、図式からの矢印の検出などの研究も行った。
|
-
[Publications] M.Fujimoto, T.Kanahori, M.Suzuki: "Infty Editor - A Mathematics Typesetting Tool with a Handwriting Interface and a Graphical Front-End to Open XM Servers"Kyoto University, RIMS Kokyuroku. 1335. 217-226 (2003)
-
[Publications] T.Kanahori, M.Suzuki: "Detection of Matrices and Segmentation of Matrix Elements in Scanned Images of Scientific Documents"Proceedings of the 7th International Conference on Document Analysis and Recognition IEEE Commuter Society Press. 126-136 (2003)
-
[Publications] A.Nomura, K.Michishita, S.Uchida, M.Suzuki: "Detection and Segmentation of Touching Characters in Mathematical Expressions"Proceedings of the 7th International Conference on Document Analysis and Recognition. 126-130 (2003)
-
[Publications] M.Suzuki, F.Tamari, R.Fukuda, S.Uchida, T.Kanahori: "INFTY - An integrated OCR system for mathematical documents"Proceedings of the 2003 ACM Symposium on Document Engineering Ed C Vanoirbeek C Roinsin E Munson. 95-104 (2003)
-
[Publications] 金堀利洋, 西村博人, 藤本光史, 鈴木昌和: "数学の授業におけるインタラクティブなコンテンツを含んだ授業教材作成システム"電子情報通信学会技術研究報告. ET2003-80. 117-122 (2003)
-
[Publications] 内田誠一, 野村明弘, 鈴木昌和: "数学文書データベースの解析"電子情報通信学会技術研究報告. PRMU2003-48. 19-24 (2003)