研究課題/領域番号 |
14380182
|
研究種目 |
基盤研究(B)
|
研究機関 | 九州大学 |
研究代表者 |
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
研究分担者 |
黄瀬 浩一 大阪府立大学, 工学部, 助教授 (80224939)
内田 誠一 九州大学, 大学院・システム情報科学研究院, 助教授 (70315125)
岡本 正行 信州大学, 工学部, 教授 (50109196)
藤本 光史 福岡教育大学, 教育学部, 講師 (20270241)
大武 信之 筑波技術短期大学, 教育方法開発センター, 助教授 (10223851)
|
キーワード | 数式認識 / 文字認識 / 科学技術文書電子化 / 電子ジャーナル / 視覚障害者支援 / 行列の認識 |
研究概要 |
本年度は研究の初年度のため、研究の基盤となる数学文書のGround Truth(認識結果の正解付きデータベース)の作成を行った。25種類の数学論文誌と2冊の書籍から約1000頁スキャニングして、これまでに開発してきた実験システムを用いて認識を行い、その文字認識結果や数式領域・テキスト領域の分離や数式構造解析結果を手入力で補正し、さらにレイアウト情報を付加して、今後の研究の基盤となるデータベースを構築した。このデータベースを用いて、今後種々の手法の評価実験が出来るのみならず、データベースから自動的に文字画像を抽出して認識辞書に追加するシステムの構築も行った。 他方、従来全く認識できなかった数式中の接触文字に対して、認識対象の文書中の非接触文字パターンと照合することにより自動的に切り分けて認識する手法を開発し、評価実験を行った。また、数式の構造解析に関しては、センターバンドの概念を用いることにより、文字の誤認識による影響が極めて少ない構造解析手法を開発し数式構造解析の成功率を高めた。さらに、従来は認識不能であった行列について、可変ブロックパターンによる矩形領域分割の問題に帰着して解く新しい手法を提案し、実装と評価実験を行った。 また、数学の学術論文誌の遡及電子化プロジェクトを進めているエッセン大学のMichler教授を中心とするグループと、引用文献の認識、ハイパーリンクの自動取得や、認識結果のPDF出力方法などについて共同研究を行った。さらに、視覚障害を持つ学生の支援センターをもつCalifornia大学のDavisキャンパスや、Karlsruhe大学、Linz大学,と交流を行い本研究で開発中のシステムのベータテストを実施する方法と具体的計画について打ち合わせを行った。
|