環境の動的変化に適応するマルチエージェントシステムの研究

研究課題

研究課題/領域番号	13780294
研究種目	若手研究(B)
配分区分	補助金
研究分野	知能情報学
研究機関	九州工業大学
研究代表者	大橋健九州工業大学, 情報工学部, 助教授 (00233239)
研究期間 (年度)	2001 – 2002
研究課題ステータス	完了 (2002年度)
配分額 *注記	2,000千円 (直接経費: 2,000千円) 2002年度: 900千円 (直接経費: 900千円) 2001年度: 1,100千円 (直接経費: 1,100千円)
キーワード	自律型ロボット / シミュレータ / 歩行ロボット / 倒立振り子 / 強化学習
研究概要	当該研究では、複数の自律型ロボットを接続したマルチエージェントシステムの開発を円滑に行う仕組みについて研究・開発を行った。ロボットを実世界で動作するエージェントと捉えると、エージェント自身の自律性とこれらエージェント間の通信を支援する機能が重要である。そこで、まずエージェント自身の機能強化として強化学習を用いた行動獲得を検討した。簡単な物理法則に基づく事例として、倒立振り子を取り上げ、重りの質量や腕の長さを変化させたときの振る舞いをリアルタイムに観測可能なシミュレータをOpenGLとC言語を用いて実装した。このシミュレータ上に、強化学習法の一手法であるアクタークリティック法を用いた制御機構を組み込み、環境を変化させても追加学習を行うことでその変化に追従できることを確認した。次に、具体的な実環境としてサッカーを取り上げ、SONYの4足ロボットをターゲットとしてプレーを実現するための機能分析及び実環境におけるリアルタイムな動作の実現を目指した。4足ロボットでは、リアルタイムに画像処理等を行いながら行動計画を立て、歩容を生成しなければならない。また、エージェント間の通信を支援するために、サッカーの実環境シミュレータと無線モニタリングツールを開発し、センサーから得られる情報を共有する仕組みを開発した。この結果、単体のロボットでは障害物により隠されてボールが見えない状況にあっても他のロボットからの情報からボールの位置を得て強調した動作が実現できることが確認できた。今後は、このシミュレータ上のエージェントに対して、行動生成や歩容の生成制御に関して強化学習機能を取り入れるなどを検討していく予定である。