研究課題
本年度は主に訳選択の根拠を考慮した翻訳システムの構築と翻訳の安定性を効率よく評価する尺度の開発に取り組み、3つの成果があった。成果1は、近年開発されたニューラルネットワークに基づく機械翻訳の枠組みに、外部情報を取り入れる手法である。具体的には、翻訳器に外部辞書や大規模テキストデータに基づく言語モデルにより計算された確率を導入することで、人間の訳選択で使われているような情報を導入することができるようになる。また、実験ではこれらの情報を導入することにより、ニューラルネットに基づく言語モデル・翻訳モデルの性能が向上することを実験的に示した。成果2は、成果1で開発されたようなニューラルネットワークに基づく翻訳を用いることによって、従来の翻訳モデルが苦手としていた長距離の依存性を考慮した翻訳を行うことが可能であることを示した。具体的には、前年度まで開発した木構造に基づく翻訳器の結果をニューラルネットワークで評価することによって、構文解析誤りへの対応、活用の一致、助動詞の使い分けなど、人間の翻訳者の文法に関する知識でカバーされている箇所で改善されることを示した。成果3は、2言語データを用いた構文解析の性能向上である。この手法では、対訳データを手がかりに、自動的に入力文の正しい構文的解釈を発見し、これを構文解析器の再学習に基づく手法である。この手法で、今までの分析で問題として明らかになった構文解析の誤りを修正し、より安定性の高い翻訳結果を得ることができるようになった。
このページは、本研究で作成したオープンソースソフトウェアを公開しているページである。
すべて 2016 2015 その他
すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件、 謝辞記載あり 3件) 学会発表 (3件) (うち国際学会 1件) 図書 (1件) 備考 (3件)
自然言語処理
巻: 23 ページ: 87-118
Proceedings of the 12th International Workshop on Spoken Language Translation
巻: 12 ページ: 147-154
Proceedings of the 2015 Conference of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies
巻: 11 ページ: 293-302
http://www.phontron.com/travatar/
https://github.com/neubig/lamtram
https://github.com/akivajp/acl2015