2016 年度実績報告書

潜在的情報の推定モデルに基づく多言語処理の研究

研究課題

研究課題/領域番号	15J12597
研究機関	東京大学
研究代表者	江里口瑛子東京大学, 工学系研究科, 特別研究員(DC1)
研究期間 (年度)	2015-04-24 – 2018-03-31
キーワード	自然言語処理 / 機械翻訳 / 機械学習
研究実績の概要	本年度は、前年度に提案したモデルの改良と、翻訳先言語における構文情報を活用したニューラル機械翻訳モデルの提案を行った。得られた研究成果は論文にまとめ、国際会議・国内会議などでそれぞれ発表を行なった。以下に、3つの研究実績の概要を挙げる。 (1) 翻訳元言語における構文情報の導入: 前年度の研究成果を元に、モデル構造の一部を改良した。大規模データを用いた英日翻訳実験を行い、提案モデルの有効性を確認した。研究成果は、自然言語処理分野の最高峰国際会議 ACLに受理され (採択率28%)、2016年8月に発表を行なった。 (2) 文字に基づく翻訳モデル: 提案手法 (1) は単語単位に出力を行う翻訳モデルであるが、これを文字単位で翻訳するモデルへと拡張した。英日翻訳実験を通して、両単位の翻訳モデルを比較・評価し、得られた結果を、2016年12月にアジア言語対の機械翻訳分野の国際ワークショップ WAT にて発表した。 (3) 翻訳先言語における構文情報の導入: ニューラル機械翻訳モデルにおける構文情報の導入は翻訳元言語側にのみ留まっていた。本研究では、翻訳先言語における係り受け構造情報に着目し、翻訳文の生成とその生成文の係り受け構造情報を同時学習する新たな翻訳モデルの提案を行ない、日英翻訳において翻訳性能の改善を確認した。研究成果は、国内会議である言語処理学会にて2017年3月に発表を行なった。その後、実験結果を追加し、まとめた研究成果が、言語処理分野の最高峰国際会議 ACLにて受理された (2017年8月に発表予定)。本研究は、アメリカ合衆国ニューヨーク大学との共同研究成果である。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本年度は、構文構造情報を利用した新たなニューラル機械翻訳モデルの提案を行った。翻訳元言語、翻訳先言語それぞれにおいて、モデルの提案を行った。いずれの提案モデルも、遠縁の言語組であるとされる英日翻訳などの翻訳タスクに適用し、翻訳性能の比較・評価を行なったところ、提案手法による翻訳性能の改善を確認することができた。
今後の研究の推進方策	これまで英日・日英言語組、そして、いくつかの欧州言語組を翻訳対象として主に取り扱ってきた。今後は、そのほか欧州言語組やアジア言語組などにおける提案モデルの有効性についてさらなる調査を行なう。また、各言語においてどのような構文的性質を利用することで、モデルの性能改善に繋がるかなど分析を進めていく予定である。

研究成果
(17件)

すべて 2017 2016 その他

すべて国際共同研究 (1件) 雑誌論文 (5件) (うち国際共著 2件、査読あり 3件、オープンアクセス 5件、謝辞記載あり 3件) 学会発表 (8件) (うち国際学会 5件、招待講演 2件) 備考 (3件)

[国際共同研究] ニューヨーク大学(米国)
- 国名
  米国
- 外国機関名
  ニューヨーク大学
[雑誌論文] Cache Friendly Parallelization of Neural Encoder-Decoder Models without Padding on Multi-core Architecture2017
- 著者名/発表者名
  Yuchen Qiao, Kazuma Hashimoto, Akiko Eriguchi, Haxia Wang, Dongsheng Wang, Yoshimasa Tsuruoka, and Kenjiro Taura
- 雑誌名
  
  Proceedings of the 6th International Workshop on Parallel and Distributed Computing for Large Scale Machine Learning and Big Data Analytics
  
  巻: 印刷中ページ: 印刷中
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Learning to Parse and Translate Improves Neural Machine Translation2017
- 著者名/発表者名
  Akiko Eriguchi, Yoshimasa Tsuruoka, and Kyunghyun Cho
- 雑誌名
  
  Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics
  
  巻: 印刷中ページ: 印刷中
- 査読あり / オープンアクセス / 国際共著 / 謝辞記載あり
[雑誌論文] Tree-to-Sequence Attentional Neural Machine Translation2016
- 著者名/発表者名
  Akiko Eriguchi, Kazuma Hashimoto, and Yoshimasa Tsuruoka
- 雑誌名
  
  Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics
  
  巻: 1 ページ: 823--833
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] Character-based Decoding in Tree-to-Sequence Attention-based Neural Machine Translation2016
- 著者名/発表者名
  Akiko Eriguchi, Kazuma Hashimoto, and Yoshimasa Tsuruoka
- 雑誌名
  
  Proceedings of the 3rd Workshop on Asian Translation (WAT2016)
  
  巻: －ページ: 175--183
- オープンアクセス / 謝辞記載あり
[雑誌論文] Domain Adaptation and Attention-Based Unknown Word Replacement in Chinese-to-Japanese Neural Machine Translation2016
- 著者名/発表者名
  Kazuma Hashimoto, Akiko Eriguchi, and Yoshimasa Tsuruoka
- 雑誌名
  
  Proceedings of the 3rd Workshop on Asian Translation (WAT2016)
  
  巻: －ページ: 75--83
- オープンアクセス
[学会発表] Learning to Parse and Translate Improves Neural Machine Translation2017
- 著者名/発表者名
  Akiko Eriguchi, Yoshimasa Tsuruoka, and Kyunghyun Cho
- 学会等名
  The 55th Annual Meeting of the Association for Computational Linguistics
- 発表場所
  Vancouver, Canada
- 年月日
  2017-07-30 – 2017-08-04
- 国際学会
[学会発表] Cache Friendly Parallelization of Neural Encoder-Decoder Models without Padding on Multi-core Architecture2017
- 著者名/発表者名
  Yuchen Qiao
- 学会等名
  The 6th International Workshop on Parallel and Distributed Computing for Large Scale Machine Learning and Big Data Analytics
- 発表場所
  Orlando, Florida, USA
- 年月日
  2017-05-29 – 2017-05-29
- 国際学会
[学会発表] 目的言語側における係り受け構造を考慮したニューラル機械翻訳2017
- 著者名/発表者名
  江里口瑛子
- 学会等名
  言語処理学会第23回年次大会
- 発表場所
  筑波大学, 茨城県つくば市
- 年月日
  2017-03-13 – 2017-03-17
[学会発表] 翻訳元言語における構文構造を利用したニューラル機械翻訳2017
- 著者名/発表者名
  江里口瑛子
- 学会等名
  第7回 AAMT/Japio特許翻訳研究会
- 発表場所
  キャンパス・イノベーションセンター東京, 東京
- 年月日
  2017-02-10 – 2017-02-10
- 招待講演
[学会発表] Character-based Decoding in Tree-to-Sequence Attention-based Neural Machine Translation2016
- 著者名/発表者名
  Akiko Eriguchi
- 学会等名
  The 3rd Workshop on Asian Translation
- 発表場所
  Osaka International Convention Center, Osaka, Japan
- 年月日
  2016-12-12 – 2016-12-12
- 国際学会
[学会発表] Domain Adaptation and Attention-Based Unknown Word Replacement in Chinese-to-Japanese Neural Machine Translation2016
- 著者名/発表者名
  Kazuma Hashimoto
- 学会等名
  The 3rd Workshop on Asian Translation
- 発表場所
  Osaka International Convention Center, Osaka, Japan
- 年月日
  2016-12-12 – 2016-12-12
- 国際学会
[学会発表] Tree-to-Sequence Attentional Neural Machine Translation2016
- 著者名/発表者名
  Akiko Eriguchi
- 学会等名
  The 54th Annual Meeting of the Association for Computational Linguistics
- 発表場所
  Berlin, Germany
- 年月日
  2016-08-07 – 2016-08-12
- 国際学会
[学会発表] 構文情報を利用したニューラルネットワークによる自然言語処理2016
- 著者名/発表者名
  橋本和真, 江里口瑛子
- 学会等名
  第38回名古屋地区NLPセミナー
- 発表場所
  名古屋大学, 愛知県名古屋市
- 年月日
  2016-04-26 – 2016-04-26
- 招待講演
[備考] Demo: Tree-to-Sequence Attentional NMT
- URL
  http://www.logos.t.u-tokyo.ac.jp/~eriguchi/demo/tree2seq/index.php
[備考] Code: Tree-to-Sequence Attentional NMT
- URL
  https://github.com/tempra28/tree2seq
[備考] Code: NMTRNNG
- URL
  https://github.com/tempra28/nmtrnng

2016 年度 実績報告書

潜在的情報の推定モデルに基づく多言語処理の研究

研究代表者

江里口 瑛子 東京大学, 工学系研究科, 特別研究員(DC1)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] ニューヨーク大学(米国)

国名

外国機関名

[雑誌論文] Cache Friendly Parallelization of Neural Encoder-Decoder Models without Padding on Multi-core Architecture2017

著者名/発表者名

雑誌名

[雑誌論文] Learning to Parse and Translate Improves Neural Machine Translation2017

著者名/発表者名

雑誌名

[雑誌論文] Tree-to-Sequence Attentional Neural Machine Translation2016

著者名/発表者名

雑誌名

[雑誌論文] Character-based Decoding in Tree-to-Sequence Attention-based Neural Machine Translation2016

著者名/発表者名

雑誌名

[雑誌論文] Domain Adaptation and Attention-Based Unknown Word Replacement in Chinese-to-Japanese Neural Machine Translation2016

著者名/発表者名

雑誌名

[学会発表] Learning to Parse and Translate Improves Neural Machine Translation2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Cache Friendly Parallelization of Neural Encoder-Decoder Models without Padding on Multi-core Architecture2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 目的言語側における係り受け構造を考慮したニューラル機械翻訳2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 翻訳元言語における構文構造を利用したニューラル機械翻訳2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Character-based Decoding in Tree-to-Sequence Attention-based Neural Machine Translation2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Domain Adaptation and Attention-Based Unknown Word Replacement in Chinese-to-Japanese Neural Machine Translation2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Tree-to-Sequence Attentional Neural Machine Translation2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 構文情報を利用したニューラルネットワークによる自然言語処理2016

著者名/発表者名

学会等名

発表場所

年月日

[備考] Demo: Tree-to-Sequence Attentional NMT

URL

[備考] Code: Tree-to-Sequence Attentional NMT

URL

[備考] Code: NMTRNNG

URL

2016 年度実績報告書

江里口瑛子東京大学, 工学系研究科, 特別研究員(DC1)