研究課題
本年度は、前年度に提案したモデルの改良と、翻訳先言語における構文情報を活用したニューラル機械翻訳モデルの提案を行った。得られた研究成果は論文にまとめ、国際会議・国内会議などでそれぞれ発表を行なった。以下に、3つの研究実績の概要を挙げる。(1) 翻訳元言語における構文情報の導入: 前年度の研究成果を元に、モデル構造の一部を改良した。大規模データを用いた英日翻訳実験を行い、提案モデルの有効性を確認した。研究成果は、自然言語処理分野の最高峰国際会議 ACLに受理され (採択率28%)、2016年8月に発表を行なった。(2) 文字に基づく翻訳モデル: 提案手法 (1) は単語単位に出力を行う翻訳モデルであるが、これを文字単位で翻訳するモデルへと拡張した。英日翻訳実験を通して、両単位の翻訳モデルを比較・評価し、得られた結果を、2016年12月にアジア言語対の機械翻訳分野の国際ワークショップ WAT にて発表した。(3) 翻訳先言語における構文情報の導入: ニューラル機械翻訳モデルにおける構文情報の導入は翻訳元言語側にのみ留まっていた。本研究では、翻訳先言語における係り受け構造情報に着目し、翻訳文の生成とその生成文の係り受け構造情報を同時学習する新たな翻訳モデルの提案を行ない、日英翻訳において翻訳性能の改善を確認した。研究成果は、国内会議である言語処理学会にて2017年3月に発表を行なった。その後、実験結果を追加し、まとめた研究成果が、言語処理分野の最高峰国際会議 ACLにて受理された (2017年8月に発表予定)。本研究は、アメリカ合衆国ニューヨーク大学との共同研究成果である。
2: おおむね順調に進展している
本年度は、構文構造情報を利用した新たなニューラル機械翻訳モデルの提案を行った。翻訳元言語、翻訳先言語それぞれにおいて、モデルの提案を行った。いずれの提案モデルも、遠縁の言語組であるとされる英日翻訳などの翻訳タスクに適用し、翻訳性能の比較・評価を行なったところ、提案手法による翻訳性能の改善を確認することができた。
これまで英日・日英言語組、そして、いくつかの欧州言語組を翻訳対象として主に取り扱ってきた。今後は、そのほか欧州言語組やアジア言語組などにおける提案モデルの有効性についてさらなる調査を行なう。また、各言語においてどのような構文的性質を利用することで、モデルの性能改善に繋がるかなど分析を進めていく予定である。
すべて 2017 2016 その他
すべて 国際共同研究 (1件) 雑誌論文 (5件) (うち国際共著 2件、 査読あり 3件、 オープンアクセス 5件、 謝辞記載あり 3件) 学会発表 (8件) (うち国際学会 5件、 招待講演 2件) 備考 (3件)
Proceedings of the 6th International Workshop on Parallel and Distributed Computing for Large Scale Machine Learning and Big Data Analytics
巻: 印刷中 ページ: 印刷中
Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics
Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics
巻: 1 ページ: 823--833
Proceedings of the 3rd Workshop on Asian Translation (WAT2016)
巻: - ページ: 175--183
巻: - ページ: 75--83
http://www.logos.t.u-tokyo.ac.jp/~eriguchi/demo/tree2seq/index.php
https://github.com/tempra28/tree2seq
https://github.com/tempra28/nmtrnng