研究課題/領域番号 |
22H00534
|
研究機関 | 京都大学 |
研究代表者 |
石井 信 京都大学, 情報学研究科, 教授 (90294280)
|
研究分担者 |
森本 淳 京都大学, 情報学研究科, 教授 (10505986)
雨森 賢一 京都大学, 高等研究院, 特定拠点准教授 (70344471)
吉田 和子 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 客員研究員 (30379599)
|
研究期間 (年度) |
2022-04-01 – 2023-03-31
|
キーワード | 敵対生成脳 / 計算論的神経科学 / 知能ロボティクス / 深層強化学習 |
研究実績の概要 |
高等生物脳におけるサンプル効率の高い学習を統一的に理論化しようとする試みである「敵対生成脳」を作業仮説とし、その脳内機構をヒトおよび霊長類の計算神経科学研究により明らかにし、脳の計算論にならった機械学習アルゴリズムとして導出、さらに、そのアルゴリズムをロボティクスに応用するという研究を進めた。 「敵対生成脳の理論」では、ヒトの視覚弁別課題遂行時の脳識別器のモデル化のため、実験課題の設定を進めた。また、本課題で使用する脳・AIハイブリッド型の画像生成法を完成させた。サル行動・神経生理学実験では、報酬と罰のせめぎあいがある状況を設定して、サル一頭の訓練を行った。「敵対生成脳のアルゴリズム」では、サンプル効率の良いモデル同定型の強化学習法、モデル同定にベイズ推定を用いる方法を中心に開発を進めた。「敵対生成脳のロボティクス応用」では、シミュレーション世界で生成した運動を実機(四脚ロボット)に転移することを課題にしたみまね学習法の開発を進めた。リカレント型ニューラルネットワークと深層強化学習を組み合わせる手法を4脚ロボットシミュレータの歩行学習に適用し、評価実験を進めた。また、本研究の前身である基盤研究(B)「脳の転移可能な機能単位からみる個性とメタ学習能力」の成果が、本課題実施中に論文化された。 こうした進捗状況は、本課題を継承する基盤(S)研究「敵対生成脳:マルチエージェント学習の計算理論、アルゴリズムとロボティクス応用」に継承した。
|
現在までの達成度 (段落) |
令和4年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和4年度が最終年度であるため、記入しない。
|