2017 Fiscal Year Annual Research Report
ディープラーニングと記号処理の融合による予測性の向上に関する研究
Project Area | Correspondence and Fusion of Artificial Intelligence and Brain Science |
Project/Area Number |
16H06562
|
Research Institution | The University of Tokyo |
Principal Investigator |
松尾 豊 東京大学, 大学院工学系研究科(工学部), 特任准教授 (30358014)
|
Co-Investigator(Kenkyū-buntansha) |
中山 浩太郎 東京大学, 大学院工学系研究科(工学部), 特任講師 (00512097)
PRENDINGER HELMU 国立情報学研究所, 大学共同利用機関等の部局等, 教授 (40390596)
|
Project Period (FY) |
2016-06-30 – 2021-03-31
|
Keywords | 人工知能 / ウェブマイニング / ディープラーニング / Deep Learning |
Outline of Annual Research Achievements |
(i)記号処理を組み込んだDeep Q Networkの構成に関しては、低次元の状態表現を獲得する手法に関する研究を進めた。具体的には、部分的な観測を扱うニューラルネットワークのモデルとして,人間の視覚的注意を模倣した注意機構(attention mechanism)を持つモデルが提案されている。しかし,これらのモデルでは,注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており,外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない。そこで、特定のタスクに依存しない方法で注意機構を学習させ,状態の予測を行う手法を構築した。 また、よりロバストな状態表現の学習を行うため、深層敵対的強化学習(DARL)を複数のドメインに対して適用する研究も行った。その結果を、深層学習に関する国際会議のワークショップで発表した。
次に (ii) 文章からの画像の生成モデルを用いた、画像空間での演算処理 に関して、文章(ソース文)から画像を生成し、それを別の言語での文章(ターゲット文)に変換する方式のニューラル機械翻訳(NMT)を実現した。単純に行うと精度の問題があるため、ソース文からターゲット文の変換を行うseq2seqのモデルに、画像の情報を加えるというアプローチをとった。すなわち、テキストと画像が持つ意味情報を,潜在変数として陽に含むニューラル翻訳モデルを提案した。実験では,Multi30kという,画像とそれに対応する英独の対訳コーパスを用い,提案モデルとの比較を行った.標準的な翻訳精度評価指標である METEORスコアにおいて全てのベースラインを上回った. また、この研究の過程において、seq2seqの学習時により密な報酬を与えることで精度がよくなることを発見し、 その結果を、深層学習に関する国際会議のワークショップで発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
テーマ(i)に関して、方向性に関する修正はあったものの、いくつかの研究結果が採択率の低いICLRのワークショップでも採択されるなど、当初計画した成果を挙げることはできている。 テーマ(ii)に関しては、当初計画した方向性にしたがって順調に進んでいる。論文成果としては当初計画した以上の成果が出ている。また、それ以外にも副次的な研究成果が出てきている。 したがって、総合的に当初計画した以上に進展していると言える。
|
Strategy for Future Research Activity |
本研究では、2つのテーマを対象に次のように研究を進める。 i)記号処理を組み込んだDeep Q Networkの構成(状態空間の表現の獲得および低次元化に関する研究) ii)文章からの画像の生成モデルを用いた、画像空間での演算処理 i)に関しては、状態空間の低次元下の研究を引き続き進める。現在は、アテンションをある種のアクションと考えているが、より複雑なアクションによる観測情報を使うように拡張する。また、世界モデルに関するいくつかの先進的な手法が出てきているので、それらを実装し、さらに性能向上をさせるための方法についての議論を行い、次年度に行う実装の計画をまとめる。 ii)に関しては、現在の翻訳に関しての研究を進展させる。特に抽象表現をどう扱うのか、また映像を介した翻訳に拡張することができないかなどの検討を行う。 他の研究班と議論を行い、画像と文章との相互変換について、例えば文法構造をどのように埋め込むことができるか等の点について研究の方向性を定める。
|
Research Products
(6 results)