研究概要 |
実用的な機械翻訳システムの実現に向け,実例から翻訳ルールを帰納的に学習し,翻訳を行う遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法を開発し、研究を行っている。本手法では、交叉により新例文を生成する過程で大量の誤った例文が生成され,その淘汰が間に合わず結果として大量の誤った翻訳ルールを生成するという問題点がある.この問題に対し,本研究課題では特に交叉位置の決定に字面,出現位置,上位概念,訳語,品詞情報などの種々の情報を利用することにより交叉位置の精度を高めるという手法を開発することを目的としている.本年度は,初年度に開発した交叉位置決定手法を用いて,大量のデータを用いた評価実験,考察を行い,それを基に本手法の改良を行う.具体的には,生成された例文の精度の評価を行い,さらにその結果が翻訳結果に与える影響について考察する.特に,交叉する対象と交叉位置を決定する際に用いられる類似度がどのくらいの点数の時が最適な翻訳結果が得られるのかを実験により解明を行った.この結果,類似度のしきい値を55とした場合に,最も多くの正翻訳例が生成されることが確認された.また,これとは別により実用的なデータを用いて本システムを評価うするために,対象データとして,前年度に行った中学1年生用の英語の教科書から一歩進め,より実用的なデータとして旅行者用英会話文を用いた.旅行者用英会話文を用いる理由は,会話文では特に省略や文脈に依存した文が多く,既存の商用の解析型翻訳システムでは,うまく訳せないことが多いが,本手法を用いるとその表現様式を学習することにより既存の商用システムでは訳せない文も訳すことができるようになるものと考えたためである.そのことを評価実験を行い確認した結果,市販の商用システムよりも高い精度で良質な翻訳が行えることが明らかになった.
|