研究概要 |
本研究を構成する1.数式を含む文書の光学的文字認識(OCR)システムの開発と2.OCRされた文書の日本語による自動読み上げシステムの開発について,平成12年度1.については以下の2点を重点的に研究した。 (1)数学記号認識の精度向上を図った。従来用いていた2種類の特徴量に新たに境界線方向線素特徴量を加え,3つの特徴量による認識結果の上位候補の順位付き投票により,認識結果を得る手法を導入して,認識率を大きく改善することが出来た。 (2)文字の誤認識や印刷書体の違いに強い数式認識手法の開発を行った。これは,曖昧さを残した形のコスト付き文字配置関係ネットワークから最小コスト全域木を求めることによって数式構造を認識する,従来にない手法である。これにより,文字の誤認識や大きさの異なる類似文字による影響が非常に小さく,安定した数式構造解析結果が得られるようになった。 2.について,平成12年度は以下の2点を重点的に研究した。 (1)前年度の評価実験で得られた意見に基づいて,数式読み上げ用音声マクロの改良を行った。例えば「数式」と「数式行」の読みによる区別を行い,さらに新たな記号や読みの追加などに対応するためユーザー辞書ユーティリティーを用意した。このユーティリティーにより,視覚障害者でも音声により新しいLa TeX記号の追加や読みの変更・追加が容易に出来るようになった。 (2)理数系専門知識に乏しい被験者による評価実験を実施し,数式が混在する高校理数系教科書程度の文書について,正確に内容を聞き取れるかどうか検討を加えた。これにより,システムを一層汎用なものに改良するための指針が得られた。
|