環境の動的変化に適応するマルチエージェントシステムの研究
Project/Area Number |
13780294
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
大橋 健 九州工業大学, 情報工学部, 助教授 (00233239)
|
Project Period (FY) |
2001 – 2002
|
Project Status |
Completed (Fiscal Year 2002)
|
Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2002: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2001: ¥1,100,000 (Direct Cost: ¥1,100,000)
|
Keywords | 自律型ロボット / シミュレータ / 歩行ロボット / 倒立振り子 / 強化学習 |
Research Abstract |
当該研究では、複数の自律型ロボットを接続したマルチエージェントシステムの開発を円滑に行う仕組みについて研究・開発を行った。ロボットを実世界で動作するエージェントと捉えると、エージェント自身の自律性とこれらエージェント間の通信を支援する機能が重要である。 そこで、まずエージェント自身の機能強化として強化学習を用いた行動獲得を検討した。簡単な物理法則に基づく事例として、倒立振り子を取り上げ、重りの質量や腕の長さを変化させたときの振る舞いをリアルタイムに観測可能なシミュレータをOpenGLとC言語を用いて実装した。このシミュレータ上に、強化学習法の一手法であるアクタークリティック法を用いた制御機構を組み込み、環境を変化させても追加学習を行うことでその変化に追従できることを確認した。 次に、具体的な実環境としてサッカーを取り上げ、SONYの4足ロボットをターゲットとしてプレーを実現するための機能分析及び実環境におけるリアルタイムな動作の実現を目指した。4足ロボットでは、リアルタイムに画像処理等を行いながら行動計画を立て、歩容を生成しなければならない。また、エージェント間の通信を支援するために、サッカーの実環境シミュレータと無線モニタリングツールを開発し、センサーから得られる情報を共有する仕組みを開発した。この結果、単体のロボットでは障害物により隠されてボールが見えない状況にあっても他のロボットからの情報からボールの位置を得て強調した動作が実現できることが確認できた。 今後は、このシミュレータ上のエージェントに対して、行動生成や歩容の生成制御に関して強化学習機能を取り入れるなどを検討していく予定である。
|
Report
(2 results)
Research Products
(3 results)