近年の機械翻訳の進歩に大きく貢献する技術として、対訳データから翻訳ルールを自動的に学習する統計的機械翻訳(SMT)がある。しかしSMTは明示的にある翻訳結果が選ばれる訳の根拠を考慮していないため、人手で構築するルールベース機械翻訳(RBMT)に比べて一部の入力文や言い回しに対して致命的な誤訳を生成することがある。本研究は、人間の翻訳者が用いる根拠を持つ訳選択ルールを自動発見し、SMTと融合する方法の開発を行った。具体的には、言語的情報に基づく翻訳システムの開発、訳選択の根拠の導入、SMTシステムの分析を効率化する枠組みの開発、多言語データにおける訳選択の根拠を発見する手法の開発を行った。
|