研究課題
1.文字認識について大量の文書画像から文書中の文字画像を分類して抽出し、画面に一覧して大量の文字のクラスタリング結果や認識結果を短時間で確認・修正できるユーザーインターフェースを開発した。これにより、正解コード付きの文字画像データを採集を効率化することができるようになり、実際にいくつかの数学のジャーナルやプロシーディング、書籍などを用いてデータベースの拡充を図るとともに、既存の数学記号認識エンジンを補完する認識辞書の生成する仕組みを作った。この手法により、シリーズになった書籍やジャーナルなどの大量の文書の電子化で、認識対象とする文書画像から半自動で文字や記号の特徴量を抽出して全体の認識率を飛躍的に向上させることができることがわかり、システムに組み込んで実証実験をおこなった。2.数式構造解析について数式中に接触文字や分離文字が含まれていても、複数の文字切り分け候補の中から正しい切り分け結果を選択する評価関数に、文字認識のスコアだけでなく隣接文字の大きさと位置関係評価値を加え、精度向上を図った。高速なパーシングを可能とするLinear Monaic Tree文法による新たに数式生成文法を導入し、数式認識結果の評価と誤認識場所を発見する関数をつくり、実証実験を行った。行列の認識については隣接行列要素との境目の判定に数式構文構造を加味し、精度向上をはかった。3.文書論理構造解析認識対象とする書籍や論文誌から、行単位の文字の大きさや太さ、書体などの特徴量を抽出し、それを自動分類する実験を行った。また、その行特徴量を用いた大小関係を定義し、章、節、小見出しの判定実験や、行特徴量とキーワードを組み合わせた、定理、補題、系などの命題記述部抽出実験を行った。
すべて 2008 その他
すべて 雑誌論文 (3件) (うち査読あり 3件) 備考 (1件)
Pattern Recognition Letters 29
ページ: 1326-1332
Lecture Notes in Artificial Intelligence 5144
ページ: 415-429
Mathematics in Computer Science Vol. 2, No. 2
ページ: 195-209
http://www.inftyproject.org