2016 年度実績報告書

ニューラルネットに基づく制御可能な自然言語生成

研究課題

研究課題/領域番号	16H05873
研究機関	奈良先端科学技術大学院大学
研究代表者	Neubig Graham 奈良先端科学技術大学院大学, 情報科学研究科, 客員准教授 (70633428)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	自然言語処理 / 機械翻訳 / 自然言語生成 / ニューラルネットワーク / 制御性 / 機械学習
研究実績の概要	本年度は、機械翻訳と系列変換モデルの制御性を向上させる上で、主に3つの研究成果があった。まず、本研究に必要な計算基盤として、ニューラルネットの柔軟な計算を可能とするニューラルネットツールキットDyNetの大幅な拡張と効率化を行った。他の既存のツールキットと比較し、計算効率や実装のしやすさに関して、その優位性を示した。また、本研究で実現された改良にもとづき、ユーザベースが大幅に増えて、現在様々な研究機関で利用されている。また、ニューラルネットに外部から情報を与える様々な手法を提案した。例えば、ニューラルネットを用いた言語モデルに頻度に基づく言語モデルの情報を取り入れて、低頻度語に対する頑健性の向上を図った。また、ニューラルネットに基づく翻訳では、外部辞書の情報を活用して、学習データに十分な学習事例が存在しない単語に対する翻訳性能の向上も実現できた。また、ニューラルネットに基づく言語生成モデルには大量な学習時間を必要とするため、効率的な実験を行うための工夫も行った。具体的には、どの単語を出力するかを確定する場合、語彙中のすべての単語を考慮せずに、単語をバイナリのビット列として扱い、それぞれのビットを推定することで計算・メモリともに大幅な削減を行うことができる。これらに加えて、来年度以降のための基盤になる統語情報を翻訳に取り組む手法や、言語資源が少ない場合における翻訳の研究などにも取り組んだ。
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由当初の予定では、28年度には入力の素性追加、事前確率の指定、翻訳辞書の利用等を予定していた。これらをすべて実現する上で、計算の効率向上やニューラルネットツールキットの大幅な拡張など、他の研究実績も実現している。
今後の研究の推進方策	29年度には、大きく分けて2つの課題に取り込む。まず、翻訳における柔軟な目標関数が指定可能な学習に取り込む予定である。これを行う上で、近年提案された、最小リスク学習や強化学習に基づく手法を適応し、翻訳結果を直接制御する目標関数を提案する。例えば、文の長さを制御する場合、その文の長さがユーザが指定した目標の長さに近い場合目標関数が高くなるような設計などが考えられる。また、別タスクに対するモデル化を行う予定である。例えば、文書要約や対話など、様々なタスクに対する柔軟な制御を実現する枠組みに取り組む。
備考	本研究で大幅に拡張・効率化されたニューラルネットツールキットDyNet

研究成果
(12件)

すべて 2017 2016 その他

すべて雑誌論文 (4件) (うち国際共著 1件、査読あり 4件、オープンアクセス 4件、謝辞記載あり 4件) 学会発表 (7件) (うち国際学会 2件、招待講演 1件) 備考 (1件)

[雑誌論文] Neural Machine Translation via Binary Code Prediction2017
- 著者名/発表者名
  Yusuke Oda, Philip Arthur, Graham Neubig, Koichiro Yoshino, Satoshi Nakamura
- 雑誌名
  
  Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL)
  
  巻: 55 ページ: 印刷中
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] Generalizing and Hybridizing Count-based and Neural Language Models2016
- 著者名/発表者名
  Graham Neubig, Chris Dyer
- 雑誌名
  
  Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing
  
  巻: 2016 ページ: 1163-1172
- 査読あり / オープンアクセス / 国際共著 / 謝辞記載あり
[雑誌論文] Incorporating Discrete Translation Lexicons into Neural Machine Translation2016
- 著者名/発表者名
  Philip Arthur, Graham Neubig, Satoshi Nakamura
- 雑誌名
  
  Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing
  
  巻: 2016 ページ: 1557-1567
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] 中間言語情報を記憶するピボット翻訳手法2016
- 著者名/発表者名
  三浦明波, Graham Neubig, Sakriani Sakti, 戸田智基, 中村哲
- 雑誌名
  
  自然言語処理
  
  巻: 23-5 ページ: 499-528
- DOI
  http://doi.org/10.5715/jnlp.23.499
- 査読あり / オープンアクセス / 謝辞記載あり
[学会発表] 目的言語側の構造を考慮した自然言語からの構文的に正しいソースコード生成2017
- 著者名/発表者名
  札場寛之, 小田悠介, 吉野幸一郎, Graham Neubig, 中村哲
- 学会等名
  言語処理学会第23回年次大会
- 発表場所
  筑波大学（茨城県つくば市）
- 年月日
  2017-03-13 – 2017-03-17
[学会発表] ニューラル機械翻訳におけるミニバッチ構成法の違いによる影響の調査2017
- 著者名/発表者名
  森下睦, 小田悠介, Graham Neubig, 吉野幸一郎, 須藤克仁, 中村哲
- 学会等名
  言語処理学会第23回年次大会
- 発表場所
  筑波大学（茨城県つくば市）
- 年月日
  2017-03-13 – 2017-03-17
[学会発表] 二値符号予測と誤り訂正に基づくコンパクトなニューラルネットワーク翻訳モデル2017
- 著者名/発表者名
  小田悠介, Philip Arthur, Graham Neubig, 吉野幸一郎, 中村哲
- 学会等名
  言語処理学会第23回年次大会
- 発表場所
  筑波大学（茨城県つくば市）
- 年月日
  2017-03-13 – 2017-03-17
[学会発表] Lexicons and Minimum Risk Training for Neural Machine Translation: NAIST-CMU at WAT20162016
- 著者名/発表者名
  Graham Neubig
- 学会等名
  Workshop on Asian Translation
- 発表場所
  Osaka International Convention Center (大阪府大阪市)
- 年月日
  2016-12-12
- 国際学会
[学会発表] Structured Neural Networks for NLP: From Idea to Code2016
- 著者名/発表者名
  Graham Neubig
- 学会等名
  Young Researcher's Symposium on Natural Language Processing
- 発表場所
  Osaka International Convention Center (大阪府大阪市)
- 年月日
  2016-12-10
- 国際学会 / 招待講演
[学会発表] 木構造を中間表現とするピボット翻訳手法2016
- 著者名/発表者名
  三浦明波, Graham Neubig, 中村哲
- 学会等名
  情報処理学会第227回自然言語処理研究会
- 発表場所
  岡山県立大学（岡山県総社市）
- 年月日
  2016-07-29 – 2016-07-30
[学会発表] 様々な分野における対訳コーパスを用いた構文解析器の自己学習効果の検証2016
- 著者名/発表者名
  森下睦, 小田悠介, Graham Neubig, 吉野幸一郎, 中村哲
- 学会等名
  情報処理学会第226回自然言語処理研究会
- 発表場所
  東京工業大学（東京都大田区）
- 年月日
  2016-05-15 – 2016-05-16
[備考] DyNet: The Dynamic Neural Network Toolkit
- URL
  https://github.com/clab/dynet/

2016 年度 実績報告書

ニューラルネットに基づく制御可能な自然言語生成

研究代表者

Neubig Graham 奈良先端科学技術大学院大学, 情報科学研究科, 客員准教授 (70633428)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Neural Machine Translation via Binary Code Prediction2017

著者名/発表者名

雑誌名

[雑誌論文] Generalizing and Hybridizing Count-based and Neural Language Models2016

著者名/発表者名

雑誌名

[雑誌論文] Incorporating Discrete Translation Lexicons into Neural Machine Translation2016

著者名/発表者名

雑誌名

[雑誌論文] 中間言語情報を記憶するピボット翻訳手法2016

著者名/発表者名

雑誌名

DOI

[学会発表] 目的言語側の構造を考慮した自然言語からの構文的に正しいソースコード生成2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] ニューラル機械翻訳におけるミニバッチ構成法の違いによる影響の調査2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 二値符号予測と誤り訂正に基づくコンパクトなニューラルネットワーク翻訳モデル2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Lexicons and Minimum Risk Training for Neural Machine Translation: NAIST-CMU at WAT20162016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Structured Neural Networks for NLP: From Idea to Code2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 木構造を中間表現とするピボット翻訳手法2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 様々な分野における対訳コーパスを用いた構文解析器の自己学習効果の検証2016

著者名/発表者名

学会等名

発表場所

年月日

[備考] DyNet: The Dynamic Neural Network Toolkit

URL

2016 年度実績報告書