• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

科学技術文献データベース化のための高精度数式認識手法の開発

研究課題

研究課題/領域番号 12680411
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 情報システム学(含情報図書館学)
研究機関信州大学

研究代表者

岡本 正行  信州大学, 工学部, 教授 (50109196)

研究期間 (年度) 2000 – 2001
研究課題ステータス 完了 (2001年度)
配分額 *注記
2,900千円 (直接経費: 2,900千円)
2001年度: 1,200千円 (直接経費: 1,200千円)
2000年度: 1,700千円 (直接経費: 1,700千円)
キーワード数式認識 / 文書画像処理 / 文字認識 / パターン認識
研究概要

これまで当研究室で開発を行ってきた数式認識システムについて、以下の点で検討を行ない,新たなシステムを作成し認識実験を行った.
(1)認識対象となる数式記号・文字フオントの充実
(2)記号・文字同士の接触、切れをより高精度に処理するためのアルゴリズムの改良
(3)広範囲の行列式,整列式の認識
(4)上つき、下つき等の添字式認識精度の高度化
(5)数式構造認識性能の定量的評価方法の開発
(6)上記(5)のための正答付きデータベース(grand truth)の作成
上記(1)については,共同研究を行っているドイツ、エッセン大学の数学文献のディジタル化プロジェクトで読み取り対象としている文献Archiv der Mathematik vol.60-65から数式記号,特殊フオント等を採取,追加し認識用辞書を構築した.(2)については新たなアルゴリズムを考案しインプリメントしたが,性能が十分でなく今後も検討を行う予定である.(3)については,高精度に行列の行,列の要素数を検出するとともに,省略記号にも対応できる手法を開発し,要素として行列や省略記号を含むものもかなりの精度で認識可能になった.また(4)については,これまで誤認識を起こしていた長い添字式や極端に小さなサイズの添字式の認識精度に向上が見られた.(5)については,部分式毎の認識結果をmathMLで表現し、(6)で作成したデータベースと比較することにより,部分構造式を含む数式認識精度を自動的に算出する手法を開発した.この結果,数式認識アルゴリズムの変更を行ったときは,容易にその効果を確認することができるようになり,これまでの試行錯誤の開発より数段に開発効率を高めることができた.これらの成果は,上記数学文献Archiv der Mathematik vol.60-65に対して再度適用し,ほぼ実用に耐えるだけの認識精度が得られることを確認している.

報告書

(3件)
  • 2001 実績報告書   研究成果報告書概要
  • 2000 実績報告書
  • 研究成果

    (12件)

すべて その他

すべて 文献書誌 (12件)

  • [文献書誌] 岡本 正行, 今井 浩樹: "数式構造認識-添字式の処理と行列への拡張-"数式認識及及び関連する科学情報処理に関する研究会資料. (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] 岡本 正行, 高木 和彦: "数式記号認識実験と接触文字の切り離し"数式認識及及び関連する科学情報処理に関する研究会資料. (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] M.Okamoto, H.Imai, K.Takagi: "Performance Evaluation of a Robust Method for Mathematical Expression Recognition"Proc. of Sixth International Conference on Document Analysis and Recognition. 121-128 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] M.Okamoto, H.Imai, K.Takagi: "Extension for Matrix Recognition and Performance Evaluation"Report on Workshop on Mathematical Document Recognition and Digitization. (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Okamoto,M., Imai,H.: "Mathematical Expression Eecognition - Extension for Script and Matrix Recognition"Report on Workshop on Mathematical Expression Eecognitipn and Related Document Processing. (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Okamoto,M., Takagi,K.: "Experiments of Mathematical Symbol Recognition and Cutting of Touching Symbols"Report on Workshop on Mathematical Expression Recognition and Related Document Processing. (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Okamoto,M., Imai,H., & Takagi,K.: "Performance Evaluation of a Robust Method for Mathematical Expression Recognition"Proc. of Sixth International Conference on Document Analysis and Recognition. 121-128 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] OKamoto,M., Imai,H., & Takagi,K.: "Extension for Matrix Recognition and Performance Evaluation"Report on Workshop on Mathematical Document Recognition and Digitization,. (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] M. Okamoto, H. Imai, K. Takagi: "Performance Evaluation of a Robust Method for Mathematical Expression Recognition"Proc. of Sixth International Conference on Document Analysis and Recognition. 121-128 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] M. Okamoto, H. Imai, K. Takagi: "Extension for Matrix Recognition and Performance Evaluation"Report on Workshop on Mathematical Document Recognition and Digitization. (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 岡本正行: "数式構造認識-添字式の処理と行列への拡張-"数式認識及及び関連する科学情報処理に関する研究会資料. (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 岡本正行: "数式記号認識実験と接触文字の切り離し"数式認識及及び関連する科学情報処理に関する研究会資料. (2001)

    • 関連する報告書
      2000 実績報告書

URL: 

公開日: 2000-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi