2023 Fiscal Year Annual Research Report
Studies on autonomous learning of agents' organizational formation for system efficiency
Project/Area Number |
20H04245
|
Research Institution | Waseda University |
Principal Investigator |
菅原 俊治 早稲田大学, 理工学術院, 教授 (70396133)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | マルチエージェントシステム / 組織行動 / 社会学習 / 機械学習 / 深層強化学習 / グループ化・組織化 / マルチエージェントプランニング |
Outline of Annual Research Achievements |
2023年度(最終年度)は、計画通り、目的2「行動規範の自律的選択による最適組織化の実現」と目的3「能力の相互バランスと相互補完を実現する共同グループ構成 」の研究を進めた。 昨年度の後半から着手した他のエージェントのモデル化による組織行動の学習、modeling others as a plyer (MOP)の研究に進展があった。組織・グループ内で適切な協調行動の実現のために他のエージェントを内部にモデル化する手法(modeling other agents, MOA)の研究は存在するが、エージェント数増加とともに計算コストも上がる。我々のMOPでは、各エージェントが自分にもっとも重要で影響すると判断したエージェントとのみ通信し、その予定行動と内部に履歴(過去に巡り会ったエージェントの情報が反映)を受取り、Stackelberg equilibriumを求めて自己の行動を決める。競争と協調が混在したpredator-prey環境で、他の手法より効率が向上すること、組織として合理的な行動を起こせることを確認した。加えて、全エージェントが自己利益を最大化すると社会的な利得が不可となる問題において、一部のエージェントが全体(他のグループメンバ)のために直接には利得とならない作業を実行するよう学習できることも確認した。 一方、グループ作業において、管理者からエージェントの行動を一部操作を可能とする学習手法について試みた。 決定的なアルゴリズムによる複数エージェントのグループ行動の一例として扱う同時搬送問題の研究も継続的に進めた。今期は、衝突回避などの行動に加え、複数のグループ(異なる能力を持つ)に属するエージェント間で、自己の行動計画と交渉を兼ねた手法を提案した。また、経路を可能な範囲で先読みしながら、衝突回避を可能とするアルゴリズムも進行しており、今後、論文としてまとめる。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|