本研究で目的とする(i) 記号処理を組み込んだDeep Q Networkの構成、ならびに (ii) 文章からの画像の生成モデルを用いた画像空間での演算処理、の基盤技術となるのが、世界モデルの構築である。世界モデルとは、センサ・アクチュエータ空間における状態の定義とその遷移を、学習に基づいて得るものであり、近年、研究が進んでいる。世界モデルの学習のためには、変分オートエンコーダ(VAE)や敵対的生成ネットワーク(GAN)をマルチモーダルに適用することや、時系列を取り扱うことなどが必要である。またロボットに適用するための基盤を整えることなども重要である。本年度は、こうした世界モデルならびに強化学習に関する研究開発を進めた。また、言語とのつながりについても研究を進めた。それらに関して、複数の国際会議に投稿・発表を行った。
また、本年度は、深層学習を中心とする人工知能技術と脳研究との橋渡しを意識して研究を行った。脳におけるさまざまな機能を深層学習の観点から解釈し、全体としての説明を作ることを行った。今後の議論につながる新規性の高いものが得られたと考えている。今後、さまざまな形で発信していく予定にしている。
|