本研究では、(1)強化学習による制御ルールの発見、(2)多重連結型ロボットの作製と制御システムの構築、(3)制御系のロバスト安定解析、の3項目を実現し、多重連結型ロボットの走行制御を行った。申請者は多重連結型ロボットの簡易なものであるトレーラ・トレック(スモ-ルスケールの模型)を用いた制御システムの構築(1994)を前段階として行っていたが、ここで開発された制御システムでは以下の問題点が存在した。(1)CCDカメラを用いて位置検出を行っているが、ほとんどがソフトウェアで処理しているためその速度が遅い。とくに、複数の運搬専用ロボットが存在すると、その数だけ位置情報の検出が必要になり、より高速な画像処理が要求される。(2)CCDカメラはロボットとは別の場所(天井)に固定されているため、実際の作業を行わせるときに不都合である。これらの問題点を改善することにより、制御システムの構築を行った。また、本研究では、強化学習により、一部の制御ルールを獲得するアルゴリズムを構築した。具体的には、有効な制御を実現するために、ロバスト安定条件を満足する解空間を求め、この空間内での制限付き強化学習法を提案した。解空間を求める場合、3つの安定条件を用意し、段階的にその条件を緩めることのよって解空間の拡大を試みた。ロバスト安定条件を満足する解空間を導く場合、この制御システムが非線形であるので線形のロバスト安定論を適用できない。申請者は非線形の制御対象に対して、sector nonlinearity(SN)の概念を適用した安定解析の一手法(1993)を提案してはいるが、多重連結型ロボットのモデル化時の誤差を考慮する必要があるため、その方法をそのまま適用することもできなかった。本研究では、そのSNの概念を拡張し、ロバストな安定条件を導くことに成功した。
|