未知の協調・環境を想定したマルチエージェント強化学習の知識転移

研究課題

研究課題/領域番号	21K17807
研究種目	若手研究
配分区分	基金
審査区分	小区分61030:知能情報学関連
研究機関	岡山大学
研究代表者	上野史岡山大学, 環境生命自然科学学域, 助教 (30880687)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円) 2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	マルチエージェントシステム / 強化学習 / ニューラルネットワーク / 未知環境 / 知識 / 知識転移
研究開始時の研究の概要	本研究では，ロボットなどの活動主体（エージェント）が複数存在するときの協調制御ルールを，周囲環境から得た情報から各々が学習するマルチエージェント強化学習において，学習すべき協調や環境が未知であるときに適応した協調行動学習法を提案する．具体的には，他の環境などで今まで学習したエージェントの学習結果を各要素に分割し，階層的に抽象化することで生成した知識を組み合わせて学習することで未知の協調・環境に適応する．
研究成果の概要	本研究では、未知の協調および環境に対する効率的な知識利用法とそれを利用したマルチエージェント強化学習の方法論を明らかにし、その効果を実験によって実証した。具体的には、環境情報をニューラルネットワークによって抽出し、それを利用した木構造による関数を知識モジュールとして提案し、木構造の関数の枝葉を繋ぎ換えそしてパラメータを強化学習により最適化することで未知の協調および環境に適応した。なお、本研究の成果は英文ジャーナル1件、国際会議2件、招待講演1件、国内学会4件の発表により報告している。
研究成果の学術的意義や社会的意義	本研究は、構造型メタ知識に基づくマルチエージェント学習という従来の研究領域に対して、要素型メタ知識を扱えるように拡張することから、学術的観点から見ると新たな研究領域を開く位置づけとなり、学術的意義が大きい。更に、この基盤技術が確立すれば、ロボットの学習結果を未知問題に転移可能となることから、複数の災害救助ロボットや宇宙探査機による問題解決が可能となる。また、災害救助ロボットで得た学習結果が宇宙探査機に活用可能となるなど、知識の相互利用が可能となるため、産業的意義そして社会的意義も極めて大きい。

報告書

(4件)

研究成果
(15件)

すべて 2024 2023 2022 2021 その他

すべて国際共同研究 (2件) 雑誌論文 (2件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (10件) (うち国際学会 5件、招待講演 1件) 図書 (1件)

[国際共同研究] Queensland University of Technology(オーストラリア)
- 関連する報告書
  2023 実績報告書
[国際共同研究] Queensland University of Technology(オーストラリア)
- 関連する報告書
  2022 実施状況報告書
[雑誌論文] Inverse Reinforcement Learning with Agents’ Biased Exploration Based on Sub-Optimal Sequential Action Data2024
- 著者名/発表者名
  Uwano Fumito、Hasegawa Satoshi、Takadama Keiki
- 雑誌名
  
  Journal of Advanced Computational Intelligence and Intelligent Informatics
  
  巻: 28 号: 2 ページ: 380-392
- DOI
  10.20965/jaciii.2024.p0380
- ISSN
  1343-0130, 1883-8014
- 年月日
  2024-03-20
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 観測粒度の違いに適応可能なマルチエージェント強化学習2023
- 著者名/発表者名
  上野史
- 雑誌名
  
  計測と制御
  
  巻: 62 号: 2 ページ: 104-104
- DOI
  10.11499/sicejl.62.104
- ISSN
  0453-4662, 1883-8170
- 年月日
  2023-02-10
- 関連する報告書
  2022 実施状況報告書
[学会発表] Reinforcement Learning in Cyclic Environmental Change for Non-Communicative Agents: A Theoretical Approach2023
- 著者名/発表者名
  Fumito Uwano
- 学会等名
  The 5th International Workshop on Explainable and Transparent AI and Multi-Agent Systems
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Hierarchical Frames-of-References in Learning Classifier Systems2023
- 著者名/発表者名
  Fumito Uwano
- 学会等名
  The Genetic and Evolutionary Computation Conference 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Implicit Cooperative Learning on Distribution of Received Reward in Multi-agent System2023
- 著者名/発表者名
  Fumito Uwano
- 学会等名
  15th International Conference on Agents and Artificial Intelligence (ICAART 2023)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Reinforcement Learning in Cyclic Environmental Change for Non-Communicative Agents: A Theoretical Approach2023
- 著者名/発表者名
  Fumito Uwano
- 学会等名
  5th International Workshop on Explainable and Transparent AI and Multi-Agent Systems (EXTRAAMAS 2023)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Design of Human-Agent-Group Interaction for Correct Opinion Sharing on Social Media2022
- 著者名/発表者名
  Fumito Uwano
- 学会等名
  25th International Conference on Human-Computer Interaction
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] マルチエージェント強化学習における知識とその境界2022
- 著者名/発表者名
  上野史
- 学会等名
  第69回自律分散システム部会研究会「若手を中心とした模倣学習・強化学習」
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] マルチエージェント強化学習の報酬設計による知識の蒸留と転移に関する一考察2022
- 著者名/発表者名
  上野史
- 学会等名
  第36回人工知能学会全国大会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 獲得報酬の分布に基づくエージェント間の暗黙的協調行動学習とその効果の検証2022
- 著者名/発表者名
  上野　史
- 学会等名
  SMASH22 Winter Symposium
- 関連する報告書
  2021 実施状況報告書
[学会発表] 未知の協調・環境を想定したマルチエージェント強化学習の知識転移2021
- 著者名/発表者名
  上野　史
- 学会等名
  境界と関係性を視座とするシステムズアプローチ調査研究会
- 関連する報告書
  2021 実施状況報告書
[学会発表] 未知の環境に適応する学習エージェント群の知識利用法の検討2021
- 著者名/発表者名
  上野　史
- 学会等名
  計測自動制御学会システム・情報部門学術講演会2021
- 関連する報告書
  2021 実施状況報告書
[図書] Explainable and Transparent AI and Multi-Agent Systems2023
- 著者名/発表者名
  Fumito Uwano and Keiki Takadama
- 総ページ数
  281
- 出版者
  Springer
- 関連する報告書
  2023 実績報告書

未知の協調・環境を想定したマルチエージェント強化学習の知識転移

研究代表者

上野 史 岡山大学, 環境生命自然科学学域, 助教 (30880687)

4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)

報告書

研究成果

[国際共同研究] Queensland University of Technology(オーストラリア)

関連する報告書

[国際共同研究] Queensland University of Technology(オーストラリア)

関連する報告書

[雑誌論文] Inverse Reinforcement Learning with Agents’ Biased Exploration Based on Sub-Optimal Sequential Action Data2024

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] 観測粒度の違いに適応可能なマルチエージェント強化学習2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[学会発表] Reinforcement Learning in Cyclic Environmental Change for Non-Communicative Agents: A Theoretical Approach2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Hierarchical Frames-of-References in Learning Classifier Systems2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Implicit Cooperative Learning on Distribution of Received Reward in Multi-agent System2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Reinforcement Learning in Cyclic Environmental Change for Non-Communicative Agents: A Theoretical Approach2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Design of Human-Agent-Group Interaction for Correct Opinion Sharing on Social Media2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] マルチエージェント強化学習における知識とその境界2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] マルチエージェント強化学習の報酬設計による知識の蒸留と転移に関する一考察2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 獲得報酬の分布に基づくエージェント間の暗黙的協調行動学習とその効果の検証2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 未知の協調・環境を想定したマルチエージェント強化学習の知識転移2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 未知の環境に適応する学習エージェント群の知識利用法の検討2021

著者名/発表者名

学会等名

関連する報告書

[図書] Explainable and Transparent AI and Multi-Agent Systems2023

著者名/発表者名

総ページ数

出版者

関連する報告書

上野史岡山大学, 環境生命自然科学学域, 助教 (30880687)