2016 Fiscal Year Annual Research Report
Project/Area Number |
15J12597
|
Research Institution | The University of Tokyo |
Principal Investigator |
江里口 瑛子 東京大学, 工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2015-04-24 – 2018-03-31
|
Keywords | 自然言語処理 / 機械翻訳 / 機械学習 |
Outline of Annual Research Achievements |
本年度は、前年度に提案したモデルの改良と、翻訳先言語における構文情報を活用したニューラル機械翻訳モデルの提案を行った。得られた研究成果は論文にまとめ、国際会議・国内会議などでそれぞれ発表を行なった。以下に、3つの研究実績の概要を挙げる。 (1) 翻訳元言語における構文情報の導入: 前年度の研究成果を元に、モデル構造の一部を改良した。大規模データを用いた英日翻訳実験を行い、提案モデルの有効性を確認した。研究成果は、自然言語処理分野の最高峰国際会議 ACLに受理され (採択率28%)、2016年8月に発表を行なった。 (2) 文字に基づく翻訳モデル: 提案手法 (1) は単語単位に出力を行う翻訳モデルであるが、これを文字単位で翻訳するモデルへと拡張した。英日翻訳実験を通して、両単位の翻訳モデルを比較・評価し、得られた結果を、2016年12月にアジア言語対の機械翻訳分野の国際ワークショップ WAT にて発表した。 (3) 翻訳先言語における構文情報の導入: ニューラル機械翻訳モデルにおける構文情報の導入は翻訳元言語側にのみ留まっていた。本研究では、翻訳先言語における係り受け構造情報に着目し、翻訳文の生成とその生成文の係り受け構造情報を同時学習する新たな翻訳モデルの提案を行ない、日英翻訳において翻訳性能の改善を確認した。研究成果は、国内会議である言語処理学会にて2017年3月に発表を行なった。その後、実験結果を追加し、まとめた研究成果が、言語処理分野の最高峰国際会議 ACLにて受理された (2017年8月に発表予定)。本研究は、アメリカ合衆国ニューヨーク大学との共同研究成果である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は、構文構造情報を利用した新たなニューラル機械翻訳モデルの提案を行った。翻訳元言語、翻訳先言語それぞれにおいて、モデルの提案を行った。いずれの提案モデルも、遠縁の言語組であるとされる英日翻訳などの翻訳タスクに適用し、翻訳性能の比較・評価を行なったところ、提案手法による翻訳性能の改善を確認することができた。
|
Strategy for Future Research Activity |
これまで英日・日英言語組、そして、いくつかの欧州言語組を翻訳対象として主に取り扱ってきた。今後は、そのほか欧州言語組やアジア言語組などにおける提案モデルの有効性についてさらなる調査を行なう。また、各言語においてどのような構文的性質を利用することで、モデルの性能改善に繋がるかなど分析を進めていく予定である。
|
Research Products
(17 results)