• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習

研究課題

研究課題/領域番号 20K23326
研究種目

研究活動スタート支援

配分区分基金
審査区分 1001:情報科学、情報工学およびその関連分野
研究機関岡山大学

研究代表者

上野 史  岡山大学, 自然科学学域, 助教 (30880687)

研究期間 (年度) 2020-09-11 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワードマルチエージェントシステム / 強化学習 / ニューラルネットワーク / 情報粒度 / 協調 / 抽象度
研究開始時の研究の概要

本研究では,ロボットのように周囲の環境から得た情報を基に行動を決める主体(エージェント)が,複数集まったときの適切な行動則を獲得するマルチエージェント強化学習を実用化する上での,センサの個体差や状況の違いによる,観測情報の粒度の違いに適応した協調行動学習法を提案する.具体的には,エージェントにおける情報の抽象度を制御し,獲得情報の粒度に従ってエージェント毎の抽象度を調整することで,適切な協調行動を学習する.

研究成果の概要

本研究ではまず,深層強化学習をエージェント同士で入力情報の粒度が異なるマルチエージェント環境に展開し,深層学習によって情報粒度を抽象化していることを分析により明らかにした.また,従来提案した動的環境に追従可能なマルチエージェント強化学習法を深層強化学習に展開することで,入力情報の粒度が異なる複数のエージェントによる迷路問題において最適方策を獲得することを示した.また,動的環境においては,入力情報の粒度が異なる場合,エージェント間で同期的に動くことが難しいため,提案手法の隠れ層に時系列データを学習可能なLSTMを導入し,適切に同期的に協調行動をとる方策を獲得することを明らかにした.

研究成果の学術的意義や社会的意義

本研究により,従来のマルチエージェント強化学習では取り上げられることのなかった入力情報の粒度の異なる状況に対する追従という新たな学問分野を切り開くことができた.また,実問題に即して考えてみても,例えば複数ロボットの協働制御を考えたときに,ロボットごとのセンサの粒度が異なることや,故障などの状況により得られる情報の粒度が変化することは一般的だが,マルチエージェント強化学習ではあまり考えられることがなかったため,実問題における性能がシミュレーションと比べて高くない傾向にあった.本研究成果による方法論で,マルチエージェント強化学習を実問題に応用する上での性能向上に寄与できたと考えられる.

報告書

(3件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 研究成果

    (6件)

すべて 2022 2021

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (5件) (うち国際学会 3件、 招待講演 1件)

  • [雑誌論文] 多次元意見共有モデル上のシグモイド関数に基づく誤報防止アルゴリズム2021

    • 著者名/発表者名
      Uwano Fumito、Kitajima Eiki、Takadama Keiki
    • 雑誌名

      人工知能学会論文誌

      巻: 36 号: 6 ページ: B-KB2_1-12

    • DOI

      10.1527/tjsai.36-6_B-KB2

    • NAID

      130008110422

    • ISSN
      1346-0714, 1346-8030
    • 年月日
      2021-11-01
    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] LSTM-based Abstraction of Hetero Observation and Transition in Non-Communicative Multi-Agent Reinforcement Learning2022

    • 著者名/発表者名
      Fumito Uwano
    • 学会等名
      14th International Conference on Agents and Artificial Intelligence (ICAART 2022)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Policy-oriented Goal Selection in Multi-Agent Reinforcement Learning for Dynamic Environments without Communication2022

    • 著者名/発表者名
      Fumito Uwano
    • 学会等名
      27th International Symposium on Artificial Life and Robotics (AROB 2022)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] A Cooperative Learning Method for Multi-Agent System with Different Input Resolutions2021

    • 著者名/発表者名
      Fumito Uwano
    • 学会等名
      4th International Symposium on Agents, Multi-Agent Systems and Robotics (ISAMSR 2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] マルチエージェントシステムにおける協調行動の抽象度と深層強化学習器の関係性の考察2021

    • 著者名/発表者名
      上野 史
    • 学会等名
      第48回知能システムシンポジウム
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 動的環境におけるマルチエージェント強化学習―不完全な情報から集団を動かす仕組み―2021

    • 著者名/発表者名
      上野 史
    • 学会等名
      第6回岡山大学AI研究会
    • 関連する報告書
      2020 実施状況報告書
    • 招待講演

URL: 

公開日: 2020-09-29   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi