• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

1999 Fiscal Year Annual Research Report

自律エージェント群による協調行動の自己組織化に関する基礎研究

Research Project

Project/Area Number 10680384
Research InstitutionThe University of Tokushima

Principal Investigator

小野 典彦  徳島大学, 工学部, 教授 (60194594)

Co-Investigator(Kenkyū-buntansha) 伊藤 拓也  徳島大学, 工学部, 助手 (50314844)
小野 功  徳島大学, 工学部, 教授 (00304551)
Keywordsマルチエージェントシステム / 強化学習 / 進化的計算 / マルチエージェント強化学習 / 人工知能 / 協調行動 / エージェント
Research Abstract

近年,強化学習手法を応用して,マルチエージェント環境におかれた自律エージェント群そのものに,試行錯誤な相互作用を行わせ,それらが採用すべき協調行動をボトムアップ的に組織化させ,それによってマルチエージェントシステムの設計者を支援しようとする試み("マルチエージェント強化学習"と呼ぶ)が数多くなされている.しかし,マルチエージェント環境におかれた自律エージェント群に、従来の強化学習を適用して適切な協調行動を獲得させようとすると,各エージェントの状態空間は組合せ的に爆発してしまう.
本研究の代表者らは,各エージェントを適度に圧縮表現された状態空間上で強化学習させることによって,この問題点を回避し得ることを実験的に示してきた.この成果は強化学習に基づく現実的なマルチエージェントシステムの設計支援の可能性を示したという意味では重要であるが,これをさらに現実的なマルチエージェント強化学習手法として発展させるためには,状態空間の適切な圧縮表現を自動的に設計するための手法を確立する必要があった.
本研究では,代表者らが提案してきた上記のマルチエージェント強化学習手法と進化的計算を併用することによって,エージェント群に,適切な状態空間表現を自動的に獲得させながら,それらが採用すべき協調行動を効果的に組織化させるための手法を提案した.提案手法は,(i)状態空間の適切な圧縮表現の自動獲得を目指して提案されている従来手法よりも優れた圧縮表現を安定的に獲得可能であること,(ii)人手によって試行錯誤的に設計された圧縮表現よりも優れた圧縮表現を獲得可能であることが実験的に確認されており,マルチエージェントシステムを構成する自律エージェントの状態表現およびその行動政策を人手に頼ることなく自動的に設計するための強力な要素技術を提供する.

  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] N.Nijo,I.Ono and N.Ono: "Evolution of Modular Structures for Multiple Reinforcement Learning Agents"Proc.5th International Symposium in Artificial Life and Robotics. 576-579 (2000)

  • [Publications] H.Fujiki,I.Ono and N.Ono: "A Reinforcement Learning Scheme based on Decision Tree Representation of State Space and Its Genetic Auquisition"Proc.5th International Symposium in Artificial Life and Robotics. 563-567 (2000)

  • [Publications] I.Ono,T.Nijo and N.Ono: "A Genetic Algorithm for Automatically Designing Modular Reinforcement Learning Agents"Proc.GECCO-2000. (発表予定). (2000)

  • [Publications] 土井幹也,小野功,小野典彦: "実環境の強化学習の適用に関する実験的考察"FAN Symposium '99 講演論文集. 133-138 (1999)

  • [Publications] 高橋みゆき,小野功,小野典彦: "報酬に遅れのある環境における行動政策の進化的獲得"FAN Symposium '99 講演論文集. 291-296 (1999)

  • [Publications] T.Ito,H.Iba and S.Sato: "Advances in Genetic Programming,Vol.3 (一部執筆)"The MIT Press. 476 (1999)

URL: 

Published: 2001-10-23   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi