研究課題/領域番号 |
07558010
|
研究機関 | 九州大学 |
研究代表者 |
鈴木 昌和 九州大学, 大学院・数理学研究科, 教授 (20112302)
|
研究分担者 |
池田 秀人 立命館大学, 理工学部, 教授 (30033905)
飯高 茂 学習院大学, 理学部, 教授 (20011588)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
|
キーワード | TeX / LaTeX / 自動点訳 / 数式認識 / OCR |
研究概要 |
1.作成中のLaTeX文書の自動点訳システムについて、種々の不具合の修正を行うと共に、 (1)Extraを用いた日本語の平仮名変換と分かち書き処理 (2)平仮名化された TeXファイルの自動点訳 (3)点訳結果の校正 の作業が統合された環境で行えるWindows 95 上のアプリケーションとして具体化した。また、読み、分かち書き位置、品詞等を含めた数学用語辞書を完成し、上記ステップ1の処理を高精度に行えるようにした。 2.自動点訳における数式入力の負担を軽減する為に、昨年に引き続き、数式を含む文書の光学読み取りシステムの研究を行った。TeXで印刷した文書については非常に高い精度認識が出来ることを実験で示した。但し、現時点では行列には対応できていない。 3.TeXのバ-ジョンによる差や複雑なユーザーマクロによる記述などの根本的解決の為、TeXが出力するDviファイルから標準的なTeXコマンドのみを用いたTEX形式のソースファイルを再構成する研究を行った。章節や定理、箇条書きなどの構造への対応も可能なアルゴリズムを求めた。数式記述部分については上記2.の数式認識アルコリズムを適用して、非常に高い精度で再現が可能であること確認した。
|