2016 Fiscal Year Annual Research Report
ディープラーニングと記号処理の融合による予測性の向上に関する研究
Project Area | Correspondence and Fusion of Artificial Intelligence and Brain Science |
Project/Area Number |
16H06562
|
Research Institution | The University of Tokyo |
Principal Investigator |
松尾 豊 東京大学, 大学院工学系研究科(工学部), 特任准教授 (30358014)
|
Co-Investigator(Kenkyū-buntansha) |
中山 浩太郎 東京大学, 大学院工学系研究科(工学部), 特任講師 (00512097)
PRENDINGER HELMU 国立情報学研究所, 大学共同利用機関等の部局等, 教授 (40390596)
|
Project Period (FY) |
2016-06-30 – 2021-03-31
|
Keywords | 人口知能 / ウエブマイニング / ディープラーニング / Deep Learning |
Outline of Annual Research Achievements |
平成28年度、本研究では、近年重要性が認識されているディープラーニングにおける生成モデルと記号の操作性を組み合わせた技術を発展させ、ディープラーニングの研究の進展のみでなく、脳機能との対比を考える上で大変に重要となる技術の開発を推進すべく下記の点において研究を進めた。ⅰ)記号処理を組み込んだ Deep Q Networkの構成、ⅱ)文章からの画像の生成モデノレを用いた画像空間での演算処理、という2点をテーマにして研究を行った。 ⅰ)に関しては、従来研究を参考にDeep Q Networkにアクションに基づくオートエンコーダを加えたものを実装し、ATARIのゲーム、あるいは囲碁を対象にし、まず、既存技術でどこまでの性能が出るのかを検証し、そのための計算機環境、およびデータセットについても整備を進めた。深層強化学習の手法はさまざまに進展しているが、実際のデータを取る上で難しい点が明らかになった。 ⅱ)に関しては、従来研究を参考に、文章と画像を変換するような技術を構築することを目指した。本年度は特に、画像を含んだ自動翻訳の技術についての検討を進め、その実装を行い、その性能や問題点等を明らかにした。いくつかのデータセットにおいて実験を行った。結果として、それほど劇的な精度の向上はないものの、従来手法よりも精度の高い翻訳のモデルを構築することができた。しかしながら、精度向上の原因は従来のRNN(LSTM)によるニューラル機械翻訳の翻訳もれに対応している点にあり、画像が有用な意味表現として使われていることではないことも分かった。どういった意味表現が言語と画像に共通するものとして優れているのかという検討が必要であることが明らかになった。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
ⅰ)については、Deep Q Networkの構成については実装と環境整備を進めることができた。 ⅱ)については、文章からの画像生成モデルを用いた、翻訳についての実装を行うことができ、期待以上の成果があった。
|
Strategy for Future Research Activity |
平成29年度には、ⅰ)に関しては、28年度に議論された実装の発展の計画に基づき、特に、アクションをいかにチャンク化していくか、状態の抽象的表現をいかに得ていくか等について、他の研究班の知見も取り入れながら実装を行う。ⅱ)に関しては、画像空間における演算を活用した演縛推論の実現に向けて、画像空間における演算についての実装を行う予定である。
|
Research Products
(4 results)