1997 Fiscal Year Annual Research Report
TeX文書のコンピューターによる自動点訳システムの開発研究
Project/Area Number |
07558010
|
Research Institution | KYUSHU UNIVERSITY |
Principal Investigator |
鈴木 昌和 九州大学, 大学院・数理学研究科, 教授 (20112302)
|
Co-Investigator(Kenkyū-buntansha) |
池田 秀人 立命館大学, 理工学部, 教授 (30033905)
飯高 茂 学習院大学, 理学部, 教授 (20011588)
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
|
Keywords | TeX / LaTeX / 自動点訳 / 数式認識 / OCR |
Research Abstract |
1.作成中のLaTeX文書の自動点訳システムについて、種々の不具合の修正を行うと共に、 (1)Extraを用いた日本語の平仮名変換と分かち書き処理 (2)平仮名化された TeXファイルの自動点訳 (3)点訳結果の校正 の作業が統合された環境で行えるWindows 95 上のアプリケーションとして具体化した。また、読み、分かち書き位置、品詞等を含めた数学用語辞書を完成し、上記ステップ1の処理を高精度に行えるようにした。 2.自動点訳における数式入力の負担を軽減する為に、昨年に引き続き、数式を含む文書の光学読み取りシステムの研究を行った。TeXで印刷した文書については非常に高い精度認識が出来ることを実験で示した。但し、現時点では行列には対応できていない。 3.TeXのバ-ジョンによる差や複雑なユーザーマクロによる記述などの根本的解決の為、TeXが出力するDviファイルから標準的なTeXコマンドのみを用いたTEX形式のソースファイルを再構成する研究を行った。章節や定理、箇条書きなどの構造への対応も可能なアルゴリズムを求めた。数式記述部分については上記2.の数式認識アルコリズムを適用して、非常に高い精度で再現が可能であること確認した。
|
Research Products
(3 results)
-
[Publications] Masakazu Suzuki: "OCRを用いた科学技術文書の自動点訳について" 電子情報通信学会技術研究報告. HCS97-8. 7-14 (1997)
-
[Publications] Yoshio Sakamoto: "On-line recognition of handwritten mathematical formulas via network" Third Asian Technology Conference in Mathematics. (掲載予定). (1998)
-
[Publications] Ryounosuke Miyazaki: "Optical recognition of printed mathematical documents." Third Asian Technology Conference in Mathematics. (掲載予定). (1998)