研究課題/領域番号 |
10558025
|
研究種目 |
基盤研究(B)
|
研究機関 | 日本大学短期大学部 |
研究代表者 |
山口 雄仁 日本大学短期大学部, 専任講師 (00182428)
|
研究分担者 |
川根 深 日本大学短期大学部, 助手 (90234088)
渡辺 哲也 障害者職業総合センター, 研究員
岡田 伸一 障害者職業総合センター, 主任研究員
鈴木 昌和 九州大学, 大学院・数理学研究科, 教授 (20112302)
|
キーワード | 数学教育 / OCR / 教育工学 / 視覚障害 / アクセシビリティー / TeX / 福祉工学 / 音声 |
研究概要 |
本研究は大きく分けて 1.数式を含む文書の光学的文字認識(OCR)システムの開発、2. OCRされた文書の日本語による自動読み上げシステムの開発、の2つの部分から構成される。それぞれについて、 1. 数式を含む科学技術文書の認識においては、テキスト部と数式部ではその表記の形態や記述文法が異なるため、はじめに文書中のテキスト領域と数式領域を正確に分離識別することが重要である。平成10年度は、既存のOCRソフトウェアーにその基本機能を損なうことなく容易に数式認識機能の追加を実現することを目的とし、 (1)科学技術文書中の数学記号(英数字・ギリシャ文字を含む)の認識を行う高速な文字認識エンジンの開発;従来手法と異なり特徴ベクトル成分を検索キーとする検索手法を取り入れ、高速性と認識対象外文字のリジェクト機能を実現 (2)その数学用文字認識エンジンを用いて、文書中の日本語領域と数式領域の切り分けを、特定の文字認識エンジンに全く依存しない手法によって行うアルゴリズムの開発と実装、を行った。 2. 必要な数式レイアウト情報を表現するため、1.でOCRされた文書はLA TeX形式で出力される。平成10年度はLA TeXに対応する日本語数式読み上げ法の整備を行い、それに基づいてエディター上に出力されたLA TeX文書を既存の日本語スクリーン・リーダーで音声出力可能な形式に変換するプログラムの開発を行った。これは、(1)LA TeX文書の音声による編集を行うための1文字説明読みモード (2)数式部分を日本語として理解出来るように読み上げる標準読みモード の2つをサポートしており、理系視覚障害学生の基本的必要性に応えるものである。
|