研究概要 |
近年,自律的に振る舞う知能ロボット群やソフトウェアエージェント群による柔軟かつ頑健な問題解決等への応用を目指して,多数の自律的なエージェントの集団で構成されるマルチエージェントシステムに関する基礎的な研究が展開されている. 本研究の目的は,適応性に乏しく,柔軟性や頑健性に欠ける現在のマルチエージェントシステムを飛躍的に適応的なものにするための要素技術,特に知能ロボットやソフトウェアエージェントの集団に協調関係を組織化させ,動的かつ適応的にその性能を向上させるための要素技術を確立することにある. 本研究では,マルチエージェントに協調関係を組織化させるための要素技術として主として強化学習をとりあげ,マルチエージェント環境での強化学習の可能性とその限界を明らかにした.一般に,強化学習アルゴリズムが組み込まれたエージェントの集団に,それらにとって最適な協調関係を試行錯誤的に組織化させようとすると,エージェントの状態空間が爆発してしまい,エージェントの実装そのものが難しいばかりでなく,仮に実装できたとしてもエージェントに効果的に強化学習を行なわせることはきわめて難しい.本研究では,この問題を解消するために,状態空間を適度に圧縮しながら強化学習を行なうための構造化強化学習を提案すると共に,その有効性を追跡問題と呼ばれるマルチエージェントによる学習問題ならびにその変形問題に適用して実験的に検証した.
|