1998 Fiscal Year Annual Research Report
数式を含む文書の自動読み上げシステムの実用化に関する研究
Project/Area Number |
10558025
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Nihon University Junior College |
Principal Investigator |
山口 雄仁 日本大学短期大学部, 専任講師 (00182428)
|
Co-Investigator(Kenkyū-buntansha) |
川根 深 日本大学短期大学部, 助手 (90234088)
渡辺 哲也 障害者職業総合センター, 研究員
岡田 伸一 障害者職業総合センター, 主任研究員
鈴木 昌和 九州大学, 大学院・数理学研究科, 教授 (20112302)
|
Keywords | 数学教育 / OCR / 教育工学 / 視覚障害 / アクセシビリティー / TeX / 福祉工学 / 音声 |
Research Abstract |
本研究は大きく分けて 1.数式を含む文書の光学的文字認識(OCR)システムの開発、2. OCRされた文書の日本語による自動読み上げシステムの開発、の2つの部分から構成される。それぞれについて、 1. 数式を含む科学技術文書の認識においては、テキスト部と数式部ではその表記の形態や記述文法が異なるため、はじめに文書中のテキスト領域と数式領域を正確に分離識別することが重要である。平成10年度は、既存のOCRソフトウェアーにその基本機能を損なうことなく容易に数式認識機能の追加を実現することを目的とし、 (1)科学技術文書中の数学記号(英数字・ギリシャ文字を含む)の認識を行う高速な文字認識エンジンの開発;従来手法と異なり特徴ベクトル成分を検索キーとする検索手法を取り入れ、高速性と認識対象外文字のリジェクト機能を実現 (2)その数学用文字認識エンジンを用いて、文書中の日本語領域と数式領域の切り分けを、特定の文字認識エンジンに全く依存しない手法によって行うアルゴリズムの開発と実装、を行った。 2. 必要な数式レイアウト情報を表現するため、1.でOCRされた文書はLA TeX形式で出力される。平成10年度はLA TeXに対応する日本語数式読み上げ法の整備を行い、それに基づいてエディター上に出力されたLA TeX文書を既存の日本語スクリーン・リーダーで音声出力可能な形式に変換するプログラムの開発を行った。これは、(1)LA TeX文書の音声による編集を行うための1文字説明読みモード (2)数式部分を日本語として理解出来るように読み上げる標準読みモード の2つをサポートしており、理系視覚障害学生の基本的必要性に応えるものである。
|
-
[Publications] M.Suzuki: "Optical Recognition of Printed Mathematical Document" Proceedings of Third Asian Technology Conference in Mathematica,Springer. 280-289 (1998)
-
[Publications] M.Suzuki: "On-Line Recognition of Handwriting Mathematical Formulas via Networks" Proceedings of Third Asian Technology Conference in Mathematica, Springer. 271-279 (1998)
-
[Publications] M.Suzuki: "Optical Recognition System of Printed Japanese Mathematical Documents" Proceedings of Third IAPR Workshop on Document Analysis Systems. 197-200 (1998)
-
[Publications] 鈴木昌和: "高速性を重視した数学記号認識とその数式を含む日本語印刷文書認識への応用" 電子情報通信学会技術研究報告. PRMU98-136. 1-8 (1998)
-
[Publications] 鈴木昌和: "ストロークの相互関係を用いたオンライン手書き数式認識" 電子情報通信学会技術研究報告. PRMU98-136. 9-16 (1998)