研究概要 |
平成21年度は翻訳システム開発と日越オンライン辞書開発に取り組んだ。 日本語-ベトナム語の自動翻訳システムについては、試作品を公開し、精度向上に取り組んだ。精度向上にあたっては、これまでに用いていた対訳コーパスの質の向上、翻訳のための前処理の研究などを行った。ベトナムと日本語は共に漢字を有するため、漢字同士のアライメントを最も効果的に取ることができるよう漢字で構成される熟語を文字単位に分割して翻訳モデルを作成し、評価実験を行った。実験の結果、日本語の文字とベトナム語の音節の対応付けは、日本語の単語とベトナム語の音節との対応付けと精度が変わらなかった。小規模の対訳コーパスについては、より小さい単位のほうが翻訳精度が高いことは既にアラビア語-英語やチェコ語-英語の翻訳研究で立証されているため、本研究はその結果を追認したにすぎなかった。また、現状では工学テキストにおける越日翻訳の精度(BLEU値)は0.25で、google翻訳の日越翻訳の0.1よりは高かったが、実用的なレベル(0.5程度)にまでいたらなかった。 オンライン辞書については、日本語能力試験出題語彙8000語とその語彙を用いた例文約30,000対を校正し、http://www.tutor.jpで公開するとともに、ベトナムでの出版を進めた。この辞書のハードコピー版は平成22年度に出版される予定である。本データは日本語とベトナム語との対照研究を進める上でも有効であり、日本語とベトナム語の相違点に即した日本語教育文法研究の基礎資料としても有効である。
|