恒常性を目的としたエージェントにおける適応的行動創発および認知発達過程の解明

研究課題

研究課題/領域番号	22KJ0907
補助金の研究課題番号	22J13620 (2022)
研究種目	特別研究員奨励費
配分区分	基金 (2023) 補助金 (2022)
応募区分	国内
審査区分	小区分61050:知能ロボティクス関連
研究機関	東京大学
研究代表者	吉田尚人東京大学, 情報理工学系研究科, 特別研究員(DC2)
研究期間 (年度)	2023-03-08 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	1,700千円 (直接経費: 1,700千円) 2023年度: 800千円 (直接経費: 800千円) 2022年度: 900千円 (直接経費: 900千円)
キーワード	深層恒常性強化学習 / 深層強化学習 / 恒常性 / 行動創発 / 強化学習 / 深層学習 / ロボット / 機械学習 / ロボティクス / 自律エージェント / 内受容感覚
研究開始時の研究の概要	ロボット等の人工のエージェントを、何らかの意味で生命的といえる特質をもつシステムとして構築し、それが自ら行動を生み出す。そのようなシステムを構築することは可能だろうか？本研究はこの問いに対して、動物が生存するための総合的な機能：恒常性からアプローチする。そして自身の身体内部の状態を外部環境との相互作用を通した制御を学習することで適応的な行動がボトムアップに生じるとする、計算神経科学に着想した行動生成手法を追求する。独居世帯の増加する我が国において、生命性をもつロボットの開発は重要な要件である。本研究はこれにより、生存を目的として統合された真に生命的なAIの基盤技術の構築をめざす。
研究実績の概要	最終年次にあたる本年度では，これまでに確立した手法の応用を展開し以下の3つの点で成果を得た．（１）ロボット内部の物理情報を内受容感覚として入力とすることで，実ロボットにおける恒常性に基づく行動創発を世界で初めて構成した．（２）栄養生物学における動物の長期的な採餌行動特性の定量化手法の1つである「栄養の幾何学的アプローチ（Geometric Framework for Nutrition, GFN）」に着目した．GFNにおいて知られている3種類の異なる長期的な行動特性が，深層恒常性強化学習を用いたシミュレーション実験を通してそれぞれエージェントの代謝ダイナミクスの差異のみによって表現可能であることを示した．（３）深層恒常性強化学習におけるより複雑な行動創発可能性を検証するため，オープンエンド性をもつ学習環境を構築し，行動最適化を実行した．その結果，エージェントは内受容感覚の恒常性に対して自明な採餌等のふるまいのほか，自身が安全となるシェルターの構築などの恒常性に対して非自明性の高いふるまいが観察された．深層恒常性強化学習に関する昨年度までの一連の基礎なシミュレーション研究については現在国際誌に投稿中であり，プレプリントで既に公開している他，深層恒常性強化学習のためのネットワーク構造の提案についてはInternational Joint Conference on Neural Networks 2023で論文が採択され口頭発表している．また（3）に関してはThe 11th International Symposium on Adaptive Motion of Animals and Machines, 2023で採択され共同研究者とともに発表している．

報告書

(2件)

2023 実績報告書
2022 実績報告書

研究成果
(6件)

すべて 2024 2023 2022

すべて学会発表 (6件) (うち国際学会 4件)

[学会発表] 深層恒常性強化学習による恒常性に対して非自明な行動の創発2024
- 著者名/発表者名
  吉田尚人, 國吉康夫
- 学会等名
  2024年度人工知能学会全国大会（第38回）
- 関連する報告書
  2023 実績報告書
[学会発表] Homeostatic Reinforcement Learning through Soft Behavior Switching with Internal Body State2023
- 著者名/発表者名
  N. Yoshida, H. Kanazawa and Y. Kuniyoshi
- 学会等名
  2023 International Joint Conference on Neural Networks (IJCNN)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Interoceptive behavior switching facilitates deep homeostatic reinforcement learning2023
- 著者名/発表者名
  N. Yoshida, H. Kanazawa, and Y. Kuniyoshi
- 学会等名
  International Symposium on Predictive Brain and Cognitive Feelings
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 深層恒常性強化学習と内受容感覚に基づく方策選択機構2023
- 著者名/発表者名
  吉田尚人, 金沢星慶, 國吉康夫
- 学会等名
  2023 年度人工知能学会全国大会(第37回)
- 関連する報告書
  2023 実績報告書
[学会発表] Homeostatic reinforcement learning explains foraging strategies2023
- 著者名/発表者名
  E. Arikawa, N. Yoshida, H. Kanazawa, and Y. Kuniyoshi
- 学会等名
  The 11th International Symposium on Adaptive Motion of Animals and Machines
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Reproducing the macroscopic property of foraging behaviour using deep homeostatic reinforcement learning2022
- 著者名/発表者名
  Naoto Yoshida, Yasuo Kuniyoshi
- 学会等名
  31st Annual Computational Neuroscience Meeting: CNS*2022
- 関連する報告書
  2022 実績報告書
- 国際学会

恒常性を目的としたエージェントにおける適応的行動創発および認知発達過程の解明

研究代表者

吉田 尚人 東京大学, 情報理工学系研究科, 特別研究員(DC2)

1,700千円 (直接経費: 1,700千円)

報告書

研究成果

[学会発表] 深層恒常性強化学習による恒常性に対して非自明な行動の創発2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Homeostatic Reinforcement Learning through Soft Behavior Switching with Internal Body State2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Interoceptive behavior switching facilitates deep homeostatic reinforcement learning2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層恒常性強化学習と内受容感覚に基づく方策選択機構2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Homeostatic reinforcement learning explains foraging strategies2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Reproducing the macroscopic property of foraging behaviour using deep homeostatic reinforcement learning2022

著者名/発表者名

学会等名

関連する報告書

吉田尚人東京大学, 情報理工学系研究科, 特別研究員(DC2)