2018 年度研究成果報告書

マルチモーダル深層エンコーダ・デコーダネットワークによるゼロショット機械翻訳

研究課題

PDF

研究課題/領域番号	16H05872
研究種目	若手研究(A)
配分区分	補助金
研究分野	知能情報学
研究機関	東京大学
研究代表者	中山英樹東京大学, 大学院情報理工学系研究科, 准教授 (00643305)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	機械翻訳 / ゼロショット学習 / マルチモーダル / 画像認識 / ニューラルネットワーク / 表現学習
研究成果の概要	本研究では、画像を異言語テキスト対応付けのハブとして活用することで、対訳テキストコーパスを必要とせず、ソース言語・ターゲット言語それぞれの画像付き単一言語ドキュメントのみから学習する機械翻訳手法を実現した。さらに、翻訳の出力多様性の向上や、手法の軽量化によるスケーラビリティの向上など、実用性を高める各種の改良を行った。これらの成果はACL, ICLRをはじめとするトップレベル国際会議に複数採択されると共に、言語処理学会年次大会で最優秀賞を二度受賞するなど高い評価を得た。
自由記述の分野	画像認識、自然言語処理
研究成果の学術的意義や社会的意義	機械翻訳はより一層の技術革新が強く求められているアプリケーションであるが、現在の一般的なアプローチにおいては、学習に用いる対訳テキストコーパスの量が性能向上の鍵となる。しかしながら、実際には同一内容を複数言語で記述したテキストドキュメントは少なく、GAFA等一部の巨大企業にデータを独占されているのが現状である。本研究で提案するアプローチでは、誰でも比較的容易に入手可能な画像付き単一言語ドキュメントのみからの学習を実現するものであり、学術的にも独創的な試みであると同時に、機械翻訳の民主化に貢献しうる点で社会的意義も大きいものであると考える。