本年度は、マルチエージェントシステムをサポートするシミュレータの基本部分の作成と実際の自律型4足歩行ロボットの行動生成を行った。 シミュレータは、グラフィックスAPIとしてOpenGLを利用し、C言語を用いて実装した。このシミュレータでは物理法則に基づく事例に対して、外部のエージェントが働きかけを行うことができるものである。外部のエージェントは、シミュレータから得られる簡単な情報から相応しい振る舞いを学習できるようにするため、強化学習の一手法であるアクタークリティック法を用いた学習器を作成し環境の変化に対する追従性を確認した。具体的には、倒立振り子を取り上げ、重りの質量などが未知の環境化において、エージェントが振り子を倒さないようにする行動を学習により獲得できることを確認した後、環境を変化させて追加学習を行うことで環境の変化に対応できることが確認できた。次年度は、このシミュレータを拡張し、複数のエージェントが協調してタスクを実現しなければならない問題に対する適応を実現していく予定である。 また、シミュレーションだけでなく、実際の4足歩行ロボットを用いて分散協調学習に関する基礎研究を行った。シミュレータでは、実際のロボットで問題になる環境の変化を詳細にシミュレーションするのは困難である。そこで、SONY ER-2100に対して、歩行プログラムを作成し、素材が異なる床面での歩行実験を行った。当然予想される通り、床の素材に応じてタイミングなどのパラメータの調整が必要であることが確認された。次年度は、歩行の調整に強化学習を組み込み、その結果をシミュレータに反映させる予定である。 これらの統合により、床の素材が異なる未知の場所において、歩行のパラメータ調整を自ら行うエージェントを複数統括するシステムの作成を目指す予定である。
|