研究課題/領域番号 |
07558010
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 展開研究 |
研究分野 |
科学教育
|
研究機関 | 九州大学 |
研究代表者 |
鈴木 昌和 九州大学, 大学院・数理学研究科, 教授 (20112302)
|
研究分担者 |
池田 秀人 立命館大学, 理工学部, 教授 (30033905)
飯高 茂 学習院大学, 理学部, 教授 (20011588)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
|
研究期間 (年度) |
1995 – 1997
|
キーワード | Tex / 自動 / 点訳 / 数式認識 / OCR |
研究概要 |
1.本研究では、数式を含む日本語のLaTeX文書の自動点訳システムの構築した。 (1)Extraによる日本語のひらがな変換と分かち書き処理 (2)平仮名化されたLaTeX文書の点字への変換と、点字文書としてのレイアウト整形 (3)点訳結果の校正(ビューアとエディタ) これらの作業を統合された環境で行えるWindows95上のアプリケーションとして構築した。更に、約7000語の数学用語の点字による読みと分かち書きの位置及び品詞コードを記した辞書を作成した。これにより、2.の処理が数学の専門書に対しても高精度で行えるよになった。 2.自動点訳における数式入力の負担を軽減する為に、数式を含む文書の光学読取りシステムの研究を行った。Texで印刷した文書については非常に高い精度認識が出来ることを実験で示した。但し、現時点では行列には対応できていない。 3.Texのバ-ジョンによる差や複雑なユーザーマクロによる記述などの根本的解決の為、Texが出力するDviファイルから標準的なTexコマンドのみを用いたTEX形式のソースファイルを再構成する研究を行った。章節や定理、箇条書きなどの構造への対応も可能なアルゴリズムを求めた。数式記述部分については上記2.の数式認識アルゴリズムを適用して、非常に高い精度で再現が可能であること確認した。
|