2007 Fiscal Year Annual Research Report
高精度数式認識と科学技術文書電子化システムの実用化のための研究開発
Project/Area Number |
18300035
|
Research Institution | Kyushu University |
Principal Investigator |
鈴木 昌和 Kyushu University, 大学院・数理学研究院, 教授 (20112302)
|
Co-Investigator(Kenkyū-buntansha) |
内田 誠一 九州大学, 大学院・システム情報科学研究院, 教授 (70315125)
岡本 正行 信州大学, 工学部, 教授 (50109196)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
藤本 光史 福岡教育大学, 教育学部, 准教授 (20270241)
金堀 利洋 筑波技術大学, 障害者高等教育センター, 准教授 (00352568)
|
Keywords | 数学認識 / 文字認識 / 科学文書電子化 / 電子ジャーナル / 視覚障害者支援 |
Research Abstract |
1.文字認識について 複数の認識手法を組み合わせる方法での認識精度の向上を計った。独自に開発している認識エンジンの認識結果の信頼度補正プログラムを加え、更に異なるメーカーで開発された2つ認識エンジンを用いて、動的計画法により局所的最適解の列を取得する方法で、著しい認識率の向上を計ることが出来た。その際、メーカーの認識エンジンは数式部を通常文宇とご認識してしまうので、認識結果の数式・テキスト文字をチェックするアルゴリズムの強化を行い、動的計画法のコストに反映させた。また、数式中の文宇・記号認識については直線成分を抽出して構造解析的な特徴を用いた評価を加えることで認識率向上や認識の信頼度の安定化を図った 2.数式構造解析について 数式構造解析の精度向上を計るため、文書毎に異なる数式記述の各種パラメータを統計的解析を行い、適合型の数式認識アルゴリズムの検討とテストを行った。また、接触文字や分離文字を含む数式の認識率向上のための準備として、認識結果のツリー文法を用いたチェックアルゴリズムの検討とその評価テストを行った。 3.行列・配列の認識と修正インターフェース 行列や配列について、要素分解のアルゴリズムの点検を行い、認識精度の向上を計った。また、図や表の認識結果を容易に修正することが出来るユーザーインターフェースの開発を行った。 4.データベース 多様な数学記号認識や文書論理構造解析の精度を向上させるための準備として、欧文・和文の多様な数学書からサンプルを採集し、Ground Truth 付きのデータベースの拡充を図った 5.図中の文字・数式認識 当初の研究計画には無かったが、数学書の電子化や自動点訳などで重要な図中の文字認識の手法を検討し、テスト的な実装を行った。
|