• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

マルチモーダル深層エンコーダ・デコーダネットワークによるゼロショット機械翻訳

研究課題

研究課題/領域番号 16H05872
研究機関東京大学

研究代表者

中山 英樹  東京大学, 大学院情報理工学系研究科, 講師 (00643305)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワード機械翻訳 / 教師なし学習 / マルチモーダル学習 / 深層学習 / 自然言語処理 / 画像認識
研究実績の概要

機械翻訳は人工知能の最も重要なアプリケーションの一つである。その実現の鍵となるのは、異言語の翻訳文が対となった対訳テキストコーパスを用いた機械学習であり、Webビッグデータに代表される大規模データによる精度向上が期待されている。しかしながら、実際には同一内容を複数言語で記述したテキストドキュメントは少ない。一方、単一言語のみに閉じたモノリンガルデータは容易かつ大量に入手可能であるため、これを有効に用いる方法論が確立できれば、従来とは比較にならない規模のビッグデータを機械翻訳へ活用し性能向上を行うことが可能になると期待される。本研究では、画像を異言語テキスト対応付けのハブとして活用することで、一切の管理された対訳テキストコーパスを必要とせず、モノリンガルデータのみからゼロショットで機械翻訳システムを学習する手法を開発する。
本年度は、提案手法の基本形を完成し、その最初の実験評価を行い、論文投稿を完了した。まず、マルチモーダル表現学習手法をソース言語・画像間とターゲット言語・画像間で同時に学習させることにより、3つのモダリティを相互に結び付ける潜在表現へのエンコーダネットワークを構築した。さらに、この潜在表現を入力としデコーダネットワークを訓練することで、任意のモダリティをターゲット言語へ変換することが可能となった。提案手法は、end-to-endに訓練可能であり、任意の深層エンコーダ・デコーダを用いることができる汎用的なモデルとなっている。本手法をIAPRC-TC12、Multi30Kなどのデータセットを用いて評価した結果、ソース言語・ターゲット言語のペアデータが学習時に存在しないゼロリソースの条件下において、実際に翻訳が可能であることが示された。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

手法の開発には質の良いデータセットが必要であるため、当初計画では複数言語と画像の組からなる小規模データセットを構築することを本年度の重要な課題としていた。しかしながら、年度開始時期に他の研究グループから同様のデータセットが提供されたため、これを用いてすぐに手法開発に取り組むことが可能がなり、そのように方針を変更した。
これにより、当初計画ではエンコーダ部分まで開発することを目標としていたが、結果的にはネットワーク全体を完成させ、評価及び論文投稿まで終了し、計画を大きく上回る進展を得た。

今後の研究の推進方策

前述の通り、ここまで予定よりも早く基本的な手法の開発と評価が終了し、時間的余裕があるため、来年度は手法の各要素を精査し、より適切なメカニズムを導入し改善することを主な目標としたい。具体的には、エンコーダの学習における適切な損失関数の導入や、デコード時のアテンション機構の設計を重要な課題と予想している。
また、当初計画の最終目標である、Webデータからの学習についても、データクローリング等の準備を進めたい。

  • 研究成果

    (5件)

すべて 2016

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 1件) 学会発表 (3件) (うち国際学会 2件、 招待講演 1件)

  • [雑誌論文] Efficient two-step middle-level part feature extraction for fine-grained visual categorization2016

    • 著者名/発表者名
      Hideki Nakayama, Tomoya Tsuda
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: Vol.E99-D ページ: pp.1626-1634

    • DOI

      10.1587/transinf.2015EDP7358

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Annotation Order Matters: Recurrent Image Annotator for Arbitrary Length Image Tagging2016

    • 著者名/発表者名
      Jiren Jin, Hideki Nakayama
    • 雑誌名

      Proceedings of International Conference on Pattern Recognition

      巻: - ページ: -

    • 査読あり
  • [学会発表] Annotation Order Matters: Recurrent Image Annotator for Arbitrary Length Image Tagging2016

    • 著者名/発表者名
      Jiren Jin, Hideki Nakayama
    • 学会等名
      International Conference on Pattern Recognition (ICPR)
    • 発表場所
      カンクン(メキシコ)
    • 年月日
      2016-12-07 – 2016-12-07
    • 国際学会
  • [学会発表] Pivot-based multimodality integration for cross-media machine intelligence2016

    • 著者名/発表者名
      Hideki Nakayama
    • 学会等名
      CEMS Topical Meeting on Soft Robotics
    • 発表場所
      理化学研究所(埼玉県和光市)
    • 年月日
      2016-10-07 – 2016-10-07
    • 国際学会 / 招待講演
  • [学会発表] Recurrent image annotator2016

    • 著者名/発表者名
      Jiren Jin, Hideki Nakayama
    • 学会等名
      第19回画像の認識・理解シンポジウム
    • 発表場所
      アクトシティ浜松(静岡県浜松市)
    • 年月日
      2016-08-02 – 2016-08-02

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi