研究概要 |
本研究を構成する 1.数式を含む文書の光学的文字認識(OCR)システムの開発と2.OCRされた文書の日本語による自動読み上げシステムの開発について平成11年度は, 1.では英文数学書からの数式切りだし,文字の誤認識や印刷書体の違いに強い数式認識手法を重点的に研究した。 (1)記号の配置や基本英単語の辞書を用いてヒューリスティックな手法で,どの程度まで分離できるかについて調査的な研究を行った。 (2)数式認識のこれまでの手法は印刷の書体に依存するものであったため,この点を改善することと,記号の誤認識が全体の数式認識に与える影響の少ない手法を開発した。 (3)数学記号認識に用いる学習データの系統的な採集を行い,昨年度試作した数学記号認識エンジンの精度向上を計った。 2.では,昨年度試作した日本語による数式読み上げシステムの改良及び評価を重点的に行った。 (1)同システムをより汎用なものにするため,市販エディターに容易にインストール可能な音声出力用マクロの形に改めた。 (2)数学の専門教育を受けた視覚障害者数名に依頼し,上記音声マクロの操作環境や個々の具体的読み上げ法などについて評価意見を求めた。またそれに基づき,いくつか改良を行った。これは来年度予定しているより広範な評価実験の準備となるものである。
|