• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

高精度数式認識と科学技術文書電子化システム実用化のための研究開発

研究課題

研究課題/領域番号 18300035
研究機関九州大学

研究代表者

鈴木 昌和  九州大学, 大学院・数理学研究院, 教授 (20112302)

キーワード数式認識 / 文字認識 / 科学文書電子化 / 電子ジャーナル / 視覚障害者支援
研究概要

1.文字認識について
大量の文書画像から文書中の文字画像を分類して抽出し、画面に一覧して大量の文字のクラスタリング結果や認識結果を短時間で確認・修正できるユーザーインターフェースを開発した。これにより、正解コード付きの文字画像データを採集を効率化することができるようになり、実際にいくつかの数学のジャーナルやプロシーディング、書籍などを用いてデータベースの拡充を図るとともに、既存の数学記号認識エンジンを補完する認識辞書の生成する仕組みを作った。
この手法により、シリーズになった書籍やジャーナルなどの大量の文書の電子化で、認識対象とする文書画像から半自動で文字や記号の特徴量を抽出して全体の認識率を飛躍的に向上させることができることがわかり、システムに組み込んで実証実験をおこなった。
2.数式構造解析について
数式中に接触文字や分離文字が含まれていても、複数の文字切り分け候補の中から正しい切り分け結果を選択する評価関数に、文字認識のスコアだけでなく隣接文字の大きさと位置関係評価値を加え、精度向上を図った。高速なパーシングを可能とするLinear Monaic Tree文法による新たに数式生成文法を導入し、数式認識結果の評価と誤認識場所を発見する関数をつくり、実証実験を行った。
行列の認識については隣接行列要素との境目の判定に数式構文構造を加味し、精度向上をはかった。
3.文書論理構造解析
認識対象とする書籍や論文誌から、行単位の文字の大きさや太さ、書体などの特徴量を抽出し、それを自動分類する実験を行った。また、その行特徴量を用いた大小関係を定義し、章、節、小見出しの判定実験や、行特徴量とキーワードを組み合わせた、定理、補題、系などの命題記述部抽出実験を行った。

  • 研究成果

    (4件)

すべて 2008 その他

すべて 雑誌論文 (3件) (うち査読あり 3件) 備考 (1件)

  • [雑誌論文] Mathematical symbol recognition with support vector machines2008

    • 著者名/発表者名
      CC. Malon, S. Uchida, M. Suzuki
    • 雑誌名

      Pattern Recognition Letters 29

      ページ: 1326-1332

    • 査読あり
  • [雑誌論文] Verification of Mathematical Formulae Based on a Combination of Context-Free Grammar and Tree Grammar2008

    • 著者名/発表者名
      Fujiyoshi, M. Suzuki, S. Uchida
    • 雑誌名

      Lecture Notes in Artificial Intelligence 5144

      ページ: 415-429

    • 査読あり
  • [雑誌論文] Identifying Subscripts and Superscripts in Mathematical Documents2008

    • 著者名/発表者名
      W. Aly, S. Uchida, M. Suzuki
    • 雑誌名

      Mathematics in Computer Science Vol. 2, No. 2

      ページ: 195-209

    • 査読あり
  • [備考]

    • URL

      http://www.inftyproject.org

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi