2021 Fiscal Year Annual Research Report
抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習
Project/Area Number |
20K23326
|
Research Institution | Okayama University |
Principal Investigator |
上野 史 岡山大学, 自然科学学域, 助教 (30880687)
|
Project Period (FY) |
2020-09-11 – 2022-03-31
|
Keywords | マルチエージェントシステム / 強化学習 / ニューラルネットワーク / 抽象度 / 協調 |
Outline of Annual Research Achievements |
本年度は,粒度が異なる入力情報をヘテロ情報として,(1)ヘテロ情報の階層的抽象化,(2)ヘテロ情報に基づくエージェント間協調行動学習,(3)動的環境への適用という3つの研究テーマの内,テーマ(2)(3)を実施し,研究全体をまとめた.具体的には,昨年度提案したヘテロ情報に基づくエージェント間の協調行動学習法を動的環境へ展開し,環境の動的変化へ追従可能な手法を新たに提案した.そして各エージェントで入力情報の粒度が異なる迷路問題でその性能を検証した.結果として,さまざまな動的変化においてもその入力情報を適切に抽象化し,協調行動が学習可能であることが明らかとなった.また,申請時点で想定していたネットワークトポロジによる抽象化は効果があるものの,それを包含する程度に層に含まれるノード数が大きければよく,本研究課題の範疇では必須のものではないことが明らかとなった.また,動的変化においては,抽象度を調整することで協調行動の学習は可能であるが,各エージェント間で協調する際のタイミングを合わせることが困難となることが明らかとなった.これは本研究開始時点では想定していないことであり,本研究課題の底の深さを垣間見れたという点において重要な成果である.本成果は4th International Symposium on Agents, Multi-Agents Systems and Robotics (ISAMSR 2021),27th International Symposium on Artificial Life and Robotics (AROB 2022),14th International Conference on Agents and Artificial Intelligence (ICAART 2022)の3件の国際会議にて発表し,人工知能学会論文誌へ1件論文が掲載されている.また,本研究成果による発表が評価され,計測自動制御学会2021年度学術奨励賞 研究奨励賞を受賞した.
|
Research Products
(4 results)