研究概要 |
本研究課題である「モデル内部形成型自律システム」の構築に必要な要素は,多様な試行に基づいて学習を行う手段,学習結果の中から未学習の状況にも適用可能な一般性の高いものを抽出して表現する手段,階層的な構造をもつ制御機構とその適切な切替え機構である.これらを実現するために,本年度に開発した主要な手段・手法は,ゲート付きニューラルネットワークとRBF(Radial Basis Function)ネットワークのノード統合手法である. ゲート付きニューラルネットワークは,ニューラルネットワーク内に信号伝達とノード発火を制御するゲートを設けたもので,異なる複数機能の切替え使用,信号の要不要の判断が可能である.これを用いると,複数階層からなる制御系とその切替え機構の構築,不要信号を学習により自動的に排除した一般性のあるモデルの構築を行うことができる. さらに,ゲートの開閉決定機構としてRBFネットワークを用い,今回開発したノード統合手法を適用することにより,さらにモデルの一般性を高め,人間にとって解釈の容易な形式とすることができる. 以上を,障害物を避けながら目標に到達する方策を強化学習を用いて学習するエージェントに対して適用することにより,学習で獲得した成果の中から一般性の高いものを抽出して表現することができることを確認した.また,複数の機能を有し,それを切り替え使用することの有効性を,非線形システムであるクレーンの制御を例題として確認した. この他,多様な試行に基づく学習を補助するものとして,多様性を実現するカオスの生成・消滅を行う方法,および学習を効率化するものとして,最適値探索手法とそのパラメータの自動設定法も開発した.
|