• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

自律エージェント群による協調行動の自己組織化に関する基礎研究

研究課題

研究課題/領域番号 10680384
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関徳島大学

研究代表者

小野 典彦  徳島大学, 工学部, 教授 (60194594)

研究分担者 伊藤 拓也  徳島大学, 工学部, 助手 (50314844)
小野 功  徳島大学, 工学部, 講師 (00304551)
研究期間 (年度) 1998 – 1999
研究課題ステータス 完了 (1999年度)
配分額 *注記
1,000千円 (直接経費: 1,000千円)
1999年度: 1,000千円 (直接経費: 1,000千円)
キーワードマルチエージェントシステム / 強化学習 / 進化的計算 / マルチエージェント強化学習 / 人工知能 / 協調行動 / エージェント / マルチエージェン強化学習 / 分散人工知能 / 創発
研究概要

近年,強化学習手法を応用して,マルチエージェント環境におかれた自律エージェント群そのものに,試行錯誤な相互作用を行わせ,それらが採用すべき協調行動をボトムアップ的に組織化させ,それによってマルチエージェントシステムの設計者を支援しようとする試み("マルチエージェント強化学習"と呼ぶ)が数多くなされている.しかし,マルチエージェント環境におかれた自律エージェント群に,従来の強化学習を適用して適切な協調行動を獲得させようとすると,各エージェントの状態空間は組合せ的に爆発してしまう.
本研究の代表者らは,各エージェントを適度に圧縮表現された状態空間上で強化学習させることによって,この問題点を回避し得ることを実験的に示してきた.この成果は強化学習に基づく現実的なマルチエージェントシステムの設計支援の可能性を示したという意味では重要であるが,これをさらに現実的なマルチエージェント強化学習手法として発展させるためには,状態空間の適切な圧縮表現を自動的に設計するための手法を確立する必要があった.
本研究では,代表者らが提案してきた上記のマルチエージェント強化学習手法と進化的計算を併用することによって,エージェント群に,適切な状態空間表現を自動的に獲得させながら,それらが採用すべき協調行動を効果的に組織化させるための手法を提案した.提案手法は,(i)状態空間の適切な圧縮表現の自動獲得を目指して提案されている従来手法よりも優れた圧縮表現を安定的に獲得可能であること,(ii)人手によって試行錯誤的に設計された圧縮表現よりも優れた圧縮表現を獲得可能であることが実験的に確認されており,マルチエージェントシステムを構成する自律エージェントの状態表現およぴその行動政策を人手に頼ることなく自動的に設計するための強力な要素技術を提供する.

報告書

(3件)
  • 1999 実績報告書   研究成果報告書概要
  • 1998 実績報告書
  • 研究成果

    (31件)

すべて その他

すべて 文献書誌 (31件)

  • [文献書誌] N.Ono and S.Yoshida: "Synthesis of Coordinated Behavior in Simulated Dodgeball Games"Proceedings of lnternational Conference on Intelligent Autonomous Systems 5. 663-668 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] N.Ono and S.Yoshida: "Synthetic Collective Behavior by Multiple Reinforcement Leaning Agents in Simulated Dodgeball Game"Proceedings of the Fourth lnternatiorlal Conference on Artificial Life and Robotics(AROB 4th '99). 540-543 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] H.Fujiki,I.Ono and N.Oho: "A Reinforcement Leaning Scheme based on Decision Tree Representation of State Space and Its Genetic Acquisition"Proceedings of the 5th lnternational Symposium on Artificial Life and Robotics(AROB 5th '00). 563-567 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] T.Nijo,I.Ono and N.Ono: "Evolution of Modular Structures for Multiple Reinforcement Leaning Agents"Proceedings of the 5th lnternational Symposium on Artificial Life and Robotics(AROB 5th '00). 576-579 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] I.Ono,T.Nijo and N.Ono: "A Genetic Algorithm Automatically Designing Modular Reinforcement Leaning Agents"Proceedings of the 2000 Genetic and Evolutionary Computation Conference(GECCO-2000). (印刷中). (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] I.Ono,M.Takahashi and N.Ono: "Evolving Neural Networks in Environments with Delayed Rewards by A Real-Coded GA using the Unimodal Normal Distribution Crossover"Proceedings of the 2000 Congress on Evolutionary Comptutation (CEC2000). (印刷中). (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] T.Ilo,H.Iba and S.Sato: "Advances in Genetic Proglamming,Vol.3(一部執筆)"The MIT Press. 476 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] N. Ono and S. Yoshida: "Synthesis of Coordinated Behavior in Simulated Dodgeball Games."Proceedings of International Conference on Intelligent Autonomous Systems. 5. 663-668 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] S. Yoshida and N. Ono: "Multi-agent Reinforcement Learning via Decomposed State Representation and Structural Credit Assignments"Proceedings of the 42ィイD1ndィエD1 Annual Conference of the Institute of Systems, Control and Information Engineers. 35-36 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] S. Yoshida and N. Ono: "Multi-agent Reinforcement Learning via Decomposed State Representation."Proceedings of the SICE 26ィイD1thィエD1 Annual Symposium on Intelligent Systems. 163-168 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] H. Fujiki, Isao Ono and N. Ono: "Decision Tree Representation of State Space for Reinforcement Learning Agents and Its Acquisition based on Genetic Programming."Proceedings of the 43ィイD1rdィエD1 Annual Conference of the Institute of Systems, Control and Information Engineers. 25-26 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] T. Nijo, Isao Ono and N. Ono: "Evolutionary Acquisition of Agent Structures in Modular Reinforcement Learning."Proceedings of the 43ィイD1rdィエD1 Annual Conference of the Institute of Systems, Control and Information Engineers. 27-28 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] N. Ono and S. Yoshida: "Synthetic Collective Behavior by Multiple Reinforcement Learning Agents in Simulated Dodgeball Game."Proceedings of the Fourth International Symposium on Artificial Life and Robotics (AROB 4th '99). 540-543 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] M. Doi. Isao Ono, N. Ono. H. Kimura and S. Kobayashi: "Discussion on Application of Reinforcement Learning in a Real Environment."Proceedings of FAN Symposium '99 in Fukui. 133-138 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] M. Takahashi, Isao Ono and N. Ono: "Evolutionary Acquisition of Policies in an Environment with Delayed Reward."Proceedings of FAN Symposium '99 in Fukui. 291-296 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] H. Fujiki, Isao Ono and N. Ono: "A Reinforcement Learning Scheme based on Decision Tree Representation of State Space and Its Genetic Acquisition."Proceedings of the Fifth International Symposium on Artificial Life and Robotics (AROB 5th '00). 563-567 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] T. Nijo, Isao Ono and N. Ono: "Evolution of Modular Structures for Multiple Reinforcement Learning Agents."Proceedings of the Fifth International Symposium on Artificial Life and Robotics (AROB 5th '00). 576-579 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] I. Ono, T. Nijo and N. Ono: "A Genetic Algorithm for Automatically Designing Modular Reinforcement Learning Agents."Proceedings of the 2000 Genetic and Evolutionary Computation Conference (GECCO-2000). (to appear).

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] I. Ono, M. Takahashi and N. Ono: "Evolving Neural Networks in Environments with Delayed Rewards by A Real-Coded GA using the Unimodal Normal Distribution Crossover."Proceedings of the 2000 Congress on Evolutionary Computation (CEC2000). (to appear). (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] N.Nijo,I.Ono and N.Ono: "Evolution of Modular Structures for Multiple Reinforcement Learning Agents"Proc.5th International Symposium in Artificial Life and Robotics. 576-579 (2000)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] H.Fujiki,I.Ono and N.Ono: "A Reinforcement Learning Scheme based on Decision Tree Representation of State Space and Its Genetic Auquisition"Proc.5th International Symposium in Artificial Life and Robotics. 563-567 (2000)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] I.Ono,T.Nijo and N.Ono: "A Genetic Algorithm for Automatically Designing Modular Reinforcement Learning Agents"Proc.GECCO-2000. (発表予定). (2000)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 土井幹也,小野功,小野典彦: "実環境の強化学習の適用に関する実験的考察"FAN Symposium '99 講演論文集. 133-138 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 高橋みゆき,小野功,小野典彦: "報酬に遅れのある環境における行動政策の進化的獲得"FAN Symposium '99 講演論文集. 291-296 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] T.Ito,H.Iba and S.Sato: "Advances in Genetic Programming,Vol.3 (一部執筆)"The MIT Press. 476 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] N.Ono,S.Yoshida: "Sgnthesis of Coordinated Behavior in Simulated Dodgehall Games" Proceedings of International Conterence on Intelligent Autonomous Systems (IAS-5). 663-668 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] N.Ono,S.Yoshida: "Synthetic Collective Behavior by Multiple Reinforcement Ledrning Agents in Simulated Dodgeball Game" Proceedings of the Fourth International Symposium on Artificial Life and Robotics. 540-543 (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] I.Ono,S.Kobayashi,K.Yoshida: "A Genetic Algorithm Taking Account of Characteristics Preseruation for Job Shop Scheduling Problems" Proceeding of International Conference on Intelligent Autonomous systems(IAS-5). 711-718 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] I.Ono,S.Kobayashi,K.Yoshida: "Global and Multi-objective Optimization for Lens Design by Real-coded Genetic Algorithms." Proceedings of International Optical Design Conference. (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 吉田伸一郎、小野功、小野典彦: "状態空間の圧縮表現に基づくマルチェージェント強化学習" 計測自動制御学会第26回知能システムシンポジウム資料. (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 小野功、喜多一、小林重信: "変数間の依存関係を考慮したGAによる連続変数と離散変数を含む関数の最適化" 計測自動制御学会第26回知能システムシンポジウム資料. (1999)

    • 関連する報告書
      1998 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi