Research Abstract |
本研究は大別して,A.音声関係,B.点字関係,C.PDF科学文書用OCR関係,の3つのシステム開発から構成される。平成19年度は,それぞれについて以下の研究開発を行った。 Aについては,音声機能付き数学文書エディタに関して,音声種類や読み上げ速度,各記号や数学構文の読み上げ方法などの設定項目を「音声メニュー」としてまとめ,ユーザーが自由に変更できるようにした。直前に読み上げた内容を表示する機能や,カーソル行の内容をLaTeXのソースとして点字ディスプレーに表示する機能も実装した。自動的に文書の指定された範囲を朗読する機能や,朗読内容をテキスト・ファイルとして出力する機能を実装し,DAISY形式の図書を製作するユーティリティ開発に道を開いた。 Bについては,視覚障害者が触読図を製作するための作図システムBplotの改良として,凸点や凸点の点線だけでなく,裏点と呼ばれる凹点や凹点の点線も点字プリンタで印字できるようにし,3種類の直径の点だけでなく,大点と呼ばれるさらに大きな点の印字も可能にした。また,触読図に1対1に対応するポストスクリプトの図画像を生成し,触読図のスキャナ画像とこのポストスクリプト図画像とを照合して,点字プリンタによる触読図の印字の信頼性を検証できるようにした。 Cについては,複数の認識手法を組み合わせる方法での認識精度の向上を計った。独自開発の認識エンジンによる認識結果の信頼度補正プログラムを加え,さらに異なるメーカーで開発された2種類の認識エンジンを同時に用いて,動的計画法により局所的最適解の列を取得する方法で,著しい認識率の向上を計ることができた。その際,メーカーの認識エンジンは数式部を通常文字と誤認識するため,認識結果の数式・テキスト文字をチェックするアルゴリズムの強化を行い,動的計画法のコストに反映させた。
|