| Project/Area Number |
22H04998
|
| Research Category |
Grant-in-Aid for Scientific Research (S)
|
| Allocation Type | Single-year Grants |
| Review Section |
Broad Section J
|
| Research Institution | Kyoto University |
Principal Investigator |
石井 信 京都大学, 情報学研究科, 教授 (90294280)
|
| Co-Investigator(Kenkyū-buntansha) |
森本 淳 京都大学, 情報学研究科, 教授 (10505986)
Seymour Ben 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究員 (10644057)
吉田 和子 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 客員研究員 (30379599)
Parmas Paavo 東京大学, 大学院工学系研究科(工学部), 特任助教 (50936309)
雨森 賢一 京都大学, 高等研究院, 特定拠点准教授 (70344471)
|
| Project Period (FY) |
2022-04-27 – 2027-03-31
|
| Project Status |
Granted (Fiscal Year 2025)
|
| Budget Amount *help |
¥193,570,000 (Direct Cost: ¥148,900,000、Indirect Cost: ¥44,670,000)
Fiscal Year 2025: ¥35,100,000 (Direct Cost: ¥27,000,000、Indirect Cost: ¥8,100,000)
Fiscal Year 2024: ¥37,440,000 (Direct Cost: ¥28,800,000、Indirect Cost: ¥8,640,000)
Fiscal Year 2023: ¥39,520,000 (Direct Cost: ¥30,400,000、Indirect Cost: ¥9,120,000)
Fiscal Year 2022: ¥49,920,000 (Direct Cost: ¥38,400,000、Indirect Cost: ¥11,520,000)
|
| Keywords | 計算神経科学 / 敵対生成ネットワーク / 意思決定 / モデルベース強化学習 / 知能ロボティクス / 敵対生成脳 / 強化学習 / ロボティクス / 計算論的神経科学 / 敵対的生成ネットワーク / Artificial Intelligence / Meta learning / Agile robotics / Artificial intelligence |
| Outline of Research at the Start |
人工知能技術の進展により、画像、音声、言語などの認識系では人間の能力を凌駕することに成功したが、未だ一般化知能の実現には遠い。運動系や意思決定系などではビッグデータを準備することは一般に困難であり、高サンプル効率の学習法の導出に期待されている。本研究では、高等生物脳の高サンプル効率の学習を理論化しようとする「敵対生成脳」を作業仮説とし、その脳内機構をヒト・霊長類の計算神経科学研究により明らかにし、機械学習アルゴリズムとして導出、さらに、人と共創するロボティクスに応用するという学際的な研究を進める。環境に複数のエージェントが存在する状況(マルチエージェント環境)への展開も進める。
|
| Outline of Annual Research Achievements |
(a) 敵対深層学習に基づき尤度と事前知識を制御可能な画像生成法を開発、ヒトの脳識別器機構を調べた。画像の尤度は脳の初期視覚野と高次視覚野により処理され、事前知識はデフォールトモードネットワークが関わることが分かった(論文投稿中)。被験者間で選好が異なるマルチエージェント意思決定課題を用いて、ヒト行動・イメージング実験を行い、他者モデルの脳内学習を説明するための計算モデルの構築を進めた。さらに、複数の画像特徴量からなる人工文字をオンライン的に生成推論する課題の作成を終え、被験者30人の行動・イメージング実験を完了した。 サル脳内の識別器機構を明らかにするため、経験に基づく自己の行動選好と行動観察に基づいて推定される他者の行動選好を統合する社会的意思決定課題を開発、行動実験を進めた。サルの社会ランクの違いに応じた、うつ・不安の神経過程を調べた。ゲノムワイド関連解析のメタ解析により、関連する脳領野の同定を行った(Karunakaran et al., 2023)。 (b) モデルベース強化学習法PIPPSに、潜在空間による世界モデルを学習するDreamerを組み合わせることで、サンプル効率の優れた制御学習手法を導出した(Parmas et al., 2023)。また、マルチエージェント模倣学習の方法論についての検討を進めた。各エージェントの役割同定と、同一役割のデータ群からの行動戦略模倣を行うことにより、マルチエージェントの動作方策が獲得されることを確認した。 (c) リカレント型ニューラルネットワークと深層強化学習を階層的に組み合わせることで、環境に応じて歩容を変化させることのできる4脚ロボットシミュレータの歩行学習法を開発、論文投稿した。さらに、敵対生成脳の学習法を導入したものは、状態の外乱に対して非常に強い耐性を有することが分かった(Goto et al., 2023)。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題は、3つのサブ研究課題(計算神経科学、人工知能、知能ロボティクス)からなる融合・学際的研究を進めるものであるが、項目6に記載の通り、全てのサブ課題において、順調に研究が進展している。 なお、コロナ禍の影響は軽減したものの、人の脳活動計測装置が本格稼働していなかったことで実験実施に困難が生じたなどの理由で、実験費の一部を次年度(2024年度)に繰り越した。しかし、期間延長に伴い実験は全て完了しており、関連して、投稿中の論文の多くは2024年度末頃に論文掲載されることとなった(次年度以降に報告)。すなわち、繰り越しに伴う2023年度計画の研究の遅れは完全になくなっている。
|
| Strategy for Future Research Activity |
ヒトを用いた計算神経科学の研究は順調であり、今後、脳内生成器の特徴づけの研究、また、マルチエージェント環境での実験とモデル化に展開する。また、識別器機能の不調がヒト精神疾患のリスクになり得るとの仮説の下での新規研究も継続的に進める。サルを用いた計算神経科学の研究はサル-サルは実験的に容易でないことが分かったので、サル-ヒトと微修正を加えた上で、行動・神経生理実験を継続実施中である。 人工知能研究は、サンプル効率の高い強化学習法の導出に成功したので、それに敵対生成モデルを組み合わせることでサンプル効率と頑健性の両者を実現する学習系の構成を目指す。 知能ロボティクス研究では、敵対生成学習による、四脚ロボットシミュレータの制御のロバスト化に成功したので、本手法の実機制御に展開する。また、この考え方はドメインランダマイゼーションなど潜在空間モデルを用いた強化学習法と思想が近いので、数理的に新規で、かつ実機制御にも利用可能なアルゴリズムの開発として継続的に研究を進める。
|
| Assessment Rating |
Interim Assessment
A: 順調に研究が進展しており、期待どおりの成果が見込まれる
|