研究概要 |
本研究の目的は,高精度で知的な学習制御系を設計するために,ニューラルネットワークが有している,1)学習制御能力,2)並列処理,3)分散情報処理,4)パターン識別能力,および遺伝的アルゴリズムが有している1)大域的最適化能力,2)進化能力を活用した知的システムを設計し,実際の制御問題へ適用し,その学習制御性能やパターン認識に基づいた知的行動計画能力などを検証することである。具体的には,以下のような研究からなっている。 (1) 画像情報とアクションに基づいたルール獲得システムの構築: 前年度に構築された画像理解システムによる周囲環境の認識と理解に基づき,望ましい行動が実現可能になる制御ルールを自律的に獲得するために,ニュートラルネットワークによるルールの学習とすでに獲得されている既存ルールへのチューニングを行うルール獲得システムの構築を行った。 (2) アクションに基づく強化学習制御の研究: 前年度で研究された学習アルゴリズムを一般化し,行動に基づく学習制御方式について考察する。とくに,本研究では高度な学習制御系を実現するために,環境に対する行動に基づいた強化学習規則を強化学習法および確率オートマトンの考え方を用いて導出した。 (3) 倒立振子の安定化: (1)の手法を倒立振子の安定化制御へ応用し,その有効性を実験的に検証した。
|