2017 Fiscal Year Annual Research Report

ディープラーニングと記号処理の融合による予測性の向上に関する研究

Planned Research

Project Area	Correspondence and Fusion of Artificial Intelligence and Brain Science
Project/Area Number	16H06562
Research Institution	The University of Tokyo
Principal Investigator	松尾豊東京大学, 大学院工学系研究科(工学部), 特任准教授 (30358014)
Co-Investigator(Kenkyū-buntansha)	中山浩太郎東京大学, 大学院工学系研究科(工学部), 特任講師 (00512097) PRENDINGER HELMU 国立情報学研究所, 大学共同利用機関等の部局等, 教授 (40390596)
Project Period (FY)	2016-06-30 – 2021-03-31
Keywords	人工知能 / ウェブマイニング / ディープラーニング / Deep Learning
Outline of Annual Research Achievements	(i)記号処理を組み込んだDeep Q Networkの構成に関しては、低次元の状態表現を獲得する手法に関する研究を進めた。具体的には、部分的な観測を扱うニューラルネットワークのモデルとして，人間の視覚的注意を模倣した注意機構(attention mechanism)を持つモデルが提案されている。しかし，これらのモデルでは，注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており，外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない。そこで、特定のタスクに依存しない方法で注意機構を学習させ，状態の予測を行う手法を構築した。また、よりロバストな状態表現の学習を行うため、深層敵対的強化学習（DARL）を複数のドメインに対して適用する研究も行った。その結果を、深層学習に関する国際会議のワークショップで発表した。次に (ii) 文章からの画像の生成モデルを用いた、画像空間での演算処理に関して、文章（ソース文）から画像を生成し、それを別の言語での文章（ターゲット文）に変換する方式のニューラル機械翻訳（NMT）を実現した。単純に行うと精度の問題があるため、ソース文からターゲット文の変換を行うseq2seqのモデルに、画像の情報を加えるというアプローチをとった。すなわち、テキストと画像が持つ意味情報を，潜在変数として陽に含むニューラル翻訳モデルを提案した。実験では，Multi30kという，画像とそれに対応する英独の対訳コーパスを用い，提案モデルとの比較を行った．標準的な翻訳精度評価指標である METEORスコアにおいて全てのベースラインを上回った．また、この研究の過程において、seq2seqの学習時により密な報酬を与えることで精度がよくなることを発見し、その結果を、深層学習に関する国際会議のワークショップで発表した。
Current Status of Research Progress	Current Status of Research Progress 1: Research has progressed more than it was originally planned. Reason テーマ(i)に関して、方向性に関する修正はあったものの、いくつかの研究結果が採択率の低いICLRのワークショップでも採択されるなど、当初計画した成果を挙げることはできている。テーマ(ii)に関しては、当初計画した方向性にしたがって順調に進んでいる。論文成果としては当初計画した以上の成果が出ている。また、それ以外にも副次的な研究成果が出てきている。したがって、総合的に当初計画した以上に進展していると言える。
Strategy for Future Research Activity	本研究では、２つのテーマを対象に次のように研究を進める。 i)記号処理を組み込んだDeep Q Networkの構成（状態空間の表現の獲得および低次元化に関する研究） ii)文章からの画像の生成モデルを用いた、画像空間での演算処理 i)に関しては、状態空間の低次元下の研究を引き続き進める。現在は、アテンションをある種のアクションと考えているが、より複雑なアクションによる観測情報を使うように拡張する。また、世界モデルに関するいくつかの先進的な手法が出てきているので、それらを実装し、さらに性能向上をさせるための方法についての議論を行い、次年度に行う実装の計画をまとめる。 ii)に関しては、現在の翻訳に関しての研究を進展させる。特に抽象表現をどう扱うのか、また映像を介した翻訳に拡張することができないかなどの検討を行う。他の研究班と議論を行い、画像と文章との相互変換について、例えば文法構造をどのように埋め込むことができるか等の点について研究の方向性を定める。

Research Products
(6 results)

All 2018 2017

All Journal Article (1 results) Presentation (5 results)

[Journal Article] 異なるモダリティ間の双方向生成のための深層生成モデル2018
- Author(s)
  鈴木雅大
- Journal Title
  
  情報処理学会論文誌
  
  Volume: Vol. 59, No. 3 Pages: 859 - 873
- DOI
  http://id.nii.ac.jp/1001/00186730/
[Presentation] Extending Robust Adversarial Reinforcement Learning Considering Adaptation and Diversity2018
- Author(s)
  Hiroaki Shioya
- Organizer
  International Conference of Learning Representation
[Presentation] Expert-based reward function training: the novel method to train sequence generators2018
- Author(s)
  Joji Toyama
- Organizer
  International Conference of Learning Representation
[Presentation] Neuron as an Agent2018
- Author(s)
  Shohei Ohsawa
- Organizer
  International Conference of Learning Representation
[Presentation] 内的報酬と敵対的学習によるタスク非依存な注意機構の学習2018
- Author(s)
  松嶋達也
- Organizer
  人工知能学会全国大会
[Presentation] 画像とテキストの潜在的な意味情報を用いたニューラル翻訳モデルの提案2017
- Author(s)
  冨山翔司
- Organizer
  人工知能学会全国大会

2017 Fiscal Year Annual Research Report

ディープラーニングと記号処理の融合による予測性の向上に関する研究

Principal Investigator

松尾 豊 東京大学, 大学院工学系研究科(工学部), 特任准教授 (30358014)

Current Status of Research Progress

Reason

Research Products

[Journal Article] 異なるモダリティ間の双方向生成のための深層生成モデル2018

Author(s)

Journal Title

DOI

[Presentation] Extending Robust Adversarial Reinforcement Learning Considering Adaptation and Diversity2018

Author(s)

Organizer

[Presentation] Expert-based reward function training: the novel method to train sequence generators2018

Author(s)

Organizer

[Presentation] Neuron as an Agent2018

Author(s)

Organizer

[Presentation] 内的報酬と敵対的学習によるタスク非依存な注意機構の学習2018

Author(s)

Organizer

[Presentation] 画像とテキストの潜在的な意味情報を用いたニューラル翻訳モデルの提案2017

Author(s)

Organizer

松尾豊東京大学, 大学院工学系研究科(工学部), 特任准教授 (30358014)