2022 年度実績報告書

エージェントの自律的組織化学習アルゴリズムとシステム効率化の実現

研究課題

研究課題/領域番号	20H04245
研究機関	早稲田大学
研究代表者	菅原俊治早稲田大学, 理工学術院, 教授 (70396133)
研究期間 (年度)	2020-04-01 – 2024-03-31
キーワード	マルチエージェントシステム / 組織行動 / 社会学習 / 機械学習 / 深層強化学習 / グループ化・組織化 / マルチエージェントプランニング
研究実績の概要	本年度は、COVID-19の影響で遅れた目的2「行動規範の自律的選択による最適組織化の実現」を進め、次に目的3「能力の相互バランスと相互補完を実現する共同グループ構成」に着手した。まず昨年度に着手した順序付き協調タスクにおいて、各エージェントが自分の前後のタスクを担当するエージェントを配慮して自己のタスクを決定・遂行する学習方法を提案した。実際に、前段タスク担当のエージェントは、後を担当するエージェントが視野内に入るまで待ち、実行する。タスク毎に協力すべき仲間の同定と、その仲間を考慮した行動を学習したと言える。第2にマルチエージェントシステムでは相互作用により、仕事をしないことが最適あるいはせずとも十分と学習したり、周囲の学習が先に進んだ影響で学習の機会を失い、行動の質に差のあるグループの発生が頻出する。この課題に対し、作業量や学習機会に不公平であると、それを感知して強化学習のランダム探索の確率を故意に上げて他のエージェントに学習機会を与え、公平な行動を実現する手法を提案した。逆に、学習が不十分なエージェントがいても、全体の要求条件を満たすならば、エネルギーの効率利用の観点からそれらは不要と判断し意図的に停止させ、各環境で真に必要なエージェント数まで自律的に削減させる手法を提案し、国際会議で発表した。学習機能には頼らない決定的なアルゴリズムによる複数エージェント（ロボットを想定）の同時搬送問題も継続的に進めた。これは、深層（強化）学習のみに頼ると間違った行動を起こすこともあり、それが許されない環境も考慮するためである。今年度は、特に実環境を考慮し、移動に遅延が発生しても継続できる実装が容易な手法を提案した。エージェントの到達性を保証する証明も加え、当該分野でトップ会議のAAMASに採択された。水平・垂直輸送混合問題への適用を想定したアルゴリズムも提案した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 COVID-19後の影響もやや残り、研究協力者の発表機会に遅延はあったが、基本的には、計画通り遂行している。特に、協力すべきエージェントの同定学習、そのために着目した情報の明確化、ならびに協調行動のための特定のエージェントを対象とした行動の学習が生成されたと言える。将来、AIプログラムが、人や組織の代理として行動するときの戦略的行動の学習の基礎の一部ができたと考える。さらに継続的に当該分野のトップレベルの国際会議AAMASにも採択されるなど、国際的にも評価も得ていると考えている。
今後の研究の推進方策	2023年度およびそれ以降については、目的３に向けて研究を進めるとともに、深層学習によらないアルゴリズムベースの研究と、深層強化学習で得られた行動の根拠や正当性を示す研究を進める。具体的には、学習結果の説明性の技術から、逆に人間側からのコントローラビリティの可能性を追求する。またアルゴリズムに基づく研究は、現状では深層（強化）学習に基づく行動には望まれない行動が含まれることもあり、それを補うため、あるいはそれを許容できない応用分野に適用するために、重要な課題と考えている。また、エージェントが組織行動のために、他の仲間の判断パターンを内部にモデル化し、それらの行動を推定しながら自己の行動を選択・適応させる研究も重要と考えており、この課題についても、今後の研究に向け着手したいと考えている。

研究成果
(12件)

すべて 2023 2022

すべて雑誌論文 (9件) (うち査読あり 8件、オープンアクセス 6件) 学会発表 (3件)

[雑誌論文] Distributed Planning with Asynchronous Execution with Local Navigation for Multi-agent Pickup and Delivery Problem2023
- 著者名/発表者名
  Yuki Miyashita, Tomoki Yamauchi and Toshiharu Sugawara
- 雑誌名
  
  Proceedings of the 22nd International Conference on Autonomous Agents and Multi-Agent Systems (AAMAS 2023)
  
  巻: - ページ: 914-922
- DOI
  10.5555/3545946.3598729
[雑誌論文] Autonomous Energy-Saving Behaviors with Fulfilling Requirements for Multi-Agent Cooperative Patrolling Problem2023
- 著者名/発表者名
  Matsumoto Kohei、Yoneda Keisuke、Sugawara Toshiharu
- 雑誌名
  
  Proceedings of the 15th International Conference on Agents and Artificial Intelligence
  
  巻: 1 ページ: 37-47
- DOI
  10.5220/0011645000003393
- 査読あり
[雑誌論文] Imbalanced Equilibrium: Emergence of?Social Asymmetric Coordinated Behavior in?Multi-agent Games2023
- 著者名/発表者名
  Bai Yidong、Sugawara Toshiharu
- 雑誌名
  
  Neural Information Processing --- Proceedings of the 29th International Conference on Neural Information Processing (ICONIP 2022) Part II
  
  巻: LNCS 13624 ページ: 305～316
- DOI
  10.1007/978-3-031-30108-7_26
- 査読あり / オープンアクセス
[雑誌論文] Negotiation Protocol with Learned Handover of Important Tasks for Planned Suspensions in Multi-agent Patrol Problems2022
- 著者名/発表者名
  Tsuiki Sota、Yoneda Keisuke、Sugawara Toshiharu
- 雑誌名
  
  Agents and Artificial Intelligence (LNAI)
  
  巻: LNAI 13786 ページ: 27～47
- DOI
  10.1007/978-3-031-22953-4_2
- 査読あり
[雑誌論文] Efficient Path and Action Planning Method for Multi-Agent Pickup and Delivery Tasks under Environmental Constraints2022
- 著者名/発表者名
  Yamauchi Tomoki、Miyashita Yuki、Sugawara Toshiharu
- 雑誌名
  
  SN Computer Science (Springer-Nature)
  
  巻: 4-83 ページ: 1-20,
- DOI
  10.1007/s42979-022-01475-5
- 査読あり / オープンアクセス
[雑誌論文] Flexible Exploration Strategies in Multi-Agent Reinforcement Learning for Instability by Mutual Learning2022
- 著者名/発表者名
  Miyashita Yuki、Sugawara Toshiharu
- 雑誌名
  
  Proceedings of the 21st IEEE International Conference on Machine Learning and Applications
  
  巻: IEEE Xplore ページ: 579-584
- DOI
  10.1109/ICMLA55696.2022.00100
- 査読あり / オープンアクセス
[雑誌論文] 一時的な優先度と退避を用いた効率的なマルチエージェント配送2022
- 著者名/発表者名
  藤谷雪北, 山内智貴, 宮下裕貴, 菅原俊治
- 雑誌名
  
  情報処理学会論文誌トランザクション:数理モデル化と応用 (TOM)
  
  巻: 15-4 ページ: 11-22
- 査読あり / オープンアクセス
[雑誌論文] Two-stage reward allocation with decay for multi-agent coordinated behavior for sequential cooperative task by using deep reinforcement learning2022
- 著者名/発表者名
  Miyashita Yuki、Sugawara Toshiharu
- 雑誌名
  
  Autonomous Intelligent Systems
  
  巻: 2-1-10 ページ: 1-18
- DOI
  10.1007/s43684-022-00029-z
- 査読あり / オープンアクセス
[雑誌論文] Task Selection Algorithm for?Multi-Agent Pickup and?Delivery with?Time Synchronization2022
- 著者名/発表者名
  Yamauchi Tomoki、Miyashita Yuki、Sugawara Toshiharu
- 雑誌名
  
  Proceedings of the 24th International Conference on Principles and Practice of Multi-Agent Systems (PRIMA 2022)
  
  巻: LNAI 13753 ページ: 458～474
- DOI
  10.1007/978-3-031-21203-1_27
- 査読あり / オープンアクセス
[学会発表] マルチエージェント資材搬送問題における動作遅延に対応した自律分散アルゴリズムの提案2022
- 著者名/発表者名
  宮下裕貴, 山内智貴, 菅原俊治
- 学会等名
  人工知能と知識処理研究会技術研究報告（電子情報通信学会）
[学会発表] Agent based Modeling and Reinforcement Learning for optimal allocation of resources2022
- 著者名/発表者名
  Rashmi Tilak and Toshiharu Sugawara
- 学会等名
  人工知能と知識処理研究会技術研究報告（電子情報通信学会）
[学会発表] 顕著性マップを用いた将棋用ニューラルネットワークの可視化2022
- 著者名/発表者名
  仲宗根元徳, 菅原俊治
- 学会等名
  人工知能と知識処理研究会技術研究報告（電子情報通信学会）

2022 年度 実績報告書

エージェントの自律的組織化学習アルゴリズムとシステム効率化の実現

研究代表者

菅原 俊治 早稲田大学, 理工学術院, 教授 (70396133)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Distributed Planning with Asynchronous Execution with Local Navigation for Multi-agent Pickup and Delivery Problem2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Autonomous Energy-Saving Behaviors with Fulfilling Requirements for Multi-Agent Cooperative Patrolling Problem2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Imbalanced Equilibrium: Emergence of?Social Asymmetric Coordinated Behavior in?Multi-agent Games2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Negotiation Protocol with Learned Handover of Important Tasks for Planned Suspensions in Multi-agent Patrol Problems2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Efficient Path and Action Planning Method for Multi-Agent Pickup and Delivery Tasks under Environmental Constraints2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Flexible Exploration Strategies in Multi-Agent Reinforcement Learning for Instability by Mutual Learning2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] 一時的な優先度と退避を用いた効率的なマルチエージェント配送2022

著者名/発表者名

雑誌名

[雑誌論文] Two-stage reward allocation with decay for multi-agent coordinated behavior for sequential cooperative task by using deep reinforcement learning2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Task Selection Algorithm for?Multi-Agent Pickup and?Delivery with?Time Synchronization2022

著者名/発表者名

雑誌名

DOI

[学会発表] マルチエージェント資材搬送問題における動作遅延に対応した自律分散アルゴリズムの提案2022

著者名/発表者名

学会等名

[学会発表] Agent based Modeling and Reinforcement Learning for optimal allocation of resources2022

著者名/発表者名

学会等名

[学会発表] 顕著性マップを用いた将棋用ニューラルネットワークの可視化2022

著者名/発表者名

学会等名

2022 年度実績報告書

菅原俊治早稲田大学, 理工学術院, 教授 (70396133)