研究概要 |
本研究の目的は,システム工学における機械学習の枠組みと制御工学における学習制御の枠組みとを結び付けることにある.そのために,(i)これまでに得られている機械学習的手法である変分ベイズ推定法を状態空間モデルへ適用し,(ii)ベイズ推定された統計的なシステムモデルを制御する手法を開発した. 上記(i)に関しては,これまで変分ベイズ法を状態空間モデルに適用した結果では,事前分布と事後分布が正確には一致しておらず,学習を繰り返し行うことができなかった点を改善,また座標変換に対して不変となるようにアルゴリズムの導出を行った,また従来法では推定できなかったパラメータの分散を直接推定できるアルゴリズムを開発した. 上記(ii)に関しては,モデルパラメータが確率分布で与えられるモデルに対する最適制御手法の開発を行い,確率的な安定性に関する考察を行い,数値例などによって有効性を確認している. 今後はこれらの結果の精密化・一般化とさらに学習と制御の統合を行ってゆく予定である.
|