研究概要 |
近い将来,生産現場,屋外作業,一般社会,科泳,宇宙探索など様々な領域において今後ますます自動化の要求が増大し,介護,メンテナンス,監視,調査,探索といった,これまで人間の柔軟性により行なって来た作業や人間が行なえなかった悪条件下での作業などにもロボットなどの自動化機器の進出が予想される.この際,機器を制御するシステムには,複雑な環境下において,より高度な柔軟性と自律適応性が求められるであろう. しかし,あらかじめ想定し得る環境状態に対して動作ルールを与えておくという従来の手法では,現実の不確実な環境においてはおのずと限界があるのは明らかである.従って,自律ロボットに代表されるような自律システムは,環境の不確実性に対処しながらタスクを実行するため,システム自らが動作ルールをつくり出して,環境に適応していく必要があると考えられる. 以上のような状況の下で,本研究では,自己創出的自律適応システムの構築を目指し,以下に示す研究を行なった. 1. 疑似四足歩行ロボットの各リンクを非同期の自律エージェントとして構成し,CSCG(Continuous Space Classifier Generator)を適用し,四足歩行ロボット実機の歩容を獲得することを試みた.光源に向かって歩くというタスクを与えて学習を行なった所,試行錯誤の結果4足歩行の歩容が獲得されることを確認した. 2. 2台のAGVがリンクで接続された台車の制御系を各AGV毎に独立なエージェントとして構成し,強化学習を適用して各AGVの制御ルールを自動的に獲得することを試みた.しかし,本問題のような動的な環境において強化学習をそのまま適用することは困難であるため,本研究では,SLA(Stochastic Learning Automata)を用いた予測器を強化学習と組み合わせることによりこの問題を回避している.計算機実験において,部屋の中を壁づたいに移動するというタスクを与えた場合,本手法を用いることにより2台のAGVの協調的な動作が獲得されることを確認した.
|