• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1999 年度 実績報告書

科学技術文書の為のOCR(光学文字読み取り)システムの開発研究

研究課題

研究課題/領域番号 10558056
研究機関九州大学

研究代表者

鈴木 昌和  九州大学, 大学院・数理学研究科, 教授 (20112302)

研究分担者 福田 亮治  大分大学, 工学部, 助教授 (70238492)
江島 俊明  九州工業大学, 情報工学部, 教授 (00124553)
玉利 文和  福岡教育大学, 教育学部, 教授 (70036937)
立川 道義  株式会社リコー, 情報通信研究所, 第31研究室長
キーワードOCR / 数学記号認識 / 数式認識 / ヤグメンテーション / 手書き数式認識
研究概要

1.数式認識関連
数式認識については、従来手法では印刷の書体に依存する手法であったため、文書データの統計的解析に基づく頑健な添え字判定法を導入した。また、記号の誤認織が全体の数式認識に与える影響の少ない手法を開発し、実験を行った。曖昧さを残した形のコスト付き文字配置関係ネットワークから最小コスト全域木を求める事によって数式構造を認識する、従来にない手法であり、その有効性の高さを確認した。今後、コスト付けの最適化法などを導入して、この手法を更に精密化して行く予定である。その準備として、数式認識で必要な各種パラメータの推定法のシミュレーションによる評価法を行った。また、英文数学書からの数式領域切り出しについても検討し、基礎的な実験を行った。
他方、数学記号認識に用いる学習データの系統的な採集を行い、数学記号認識エンジンの精度向上も計った。
2.手書きによる数式編集インターフェース
OCRにおいては誤認識は避けられない問題であり、システム構築においては誤認識を修正するインターフェースは重要である。本年度は、ユーザーにとって最も易しい数式編集インターフェースとして、マウスやペン入力による数式入力・編集システムを開発した。オンライン手書き文字の遂次認識法を導入し、スムーズな数式入力法を実現した。手書きによる文字や記号の大きさ・位置の乱れを自動的に最適な大きさ・位置にシステムが書き換えていくことによって、数式構文認識の精度を向上する手法であり、実験によって使いやすいインターフェースであることを確認した。

  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] R.Fukuda: "A Technique of Mathematical Expression Sturucture Analysis for the Handwriting Input System"Proceedings of 5th ICDAR,Bangalore. 131-134 (1999)

  • [文献書誌] H.Okamura: "Handwriting Interface for Computer Algevra Systems"Proceedings of 4th ATCM,Guangzhou. 291-300 (1999)

  • [文献書誌] 江藤裕子: "最小コスト全域木探索を用いたオフライン数式構文認識"電子情報通信学会技術研究報告,PRMU. 99-236. 37-43 (2000)

  • [文献書誌] 能隅進一: "絞り込み方による数式文字認識とその日本語/数式領域切りだしへの応用"電子情報通信学会論文誌. j83-DII,No.3(掲載予定). (2000)

URL: 

公開日: 2001-10-23   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi