2022 Fiscal Year Annual Research Report
Data-Driven Learning Optimization of Dynamical System with Stochastic Uncertainty and Its Application
Project/Area Number |
19K15019
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
豊田 充 東京都立大学, システムデザイン研究科, 助教 (40826939)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 制御工学 / 最適化アルゴリズム / スパース最適化 / ガウス過程回帰 |
Outline of Annual Research Achievements |
前年度扱った離散値制御に関連するl2ノルムの和Sum-Of-l2-Norms (SOl2N)を含む最適化問題の解法およびブーリアンネットワークの研究を継続して実施した.加えて,連続値をとる不確かなシステムの解析として,ガウス過程回帰に基づいた確率的な不確かさをもつシステムの制御手法の研究を行った.主な内容は以下のとおりである: (1) 前年度に離散値制御のモデルとして提案したl2ノルムの和Sum-Of-l2-Norms (SOl2N)を導入することで得られる,最適解を離散値に近づけるような正則化項を導入した問題設定における最適化アルゴリズムの研究を行った.SOl2N型コストは微分可能でなく勾配を使ったアルゴリズムは直接適用できず,また近接写像と呼ばれるある種の最適化問題の解も容易には求まらない点に難しさがある.この難点に対して,劣勾配をはじめとするアルゴリズムの適用の検討を行った. (2) ブーリアンネットワークにおいて,カルバック--ライブラーダイバージェンスと呼ばれるある種の正則化項を導入した最適化問題の解法の研究に取り組んだ.この正則化項の重みをゼロに収束させたとき,および無限大に発散させたときの最適値と最適解の収束の挙動に着目して収束解析を行った. (3) 本課題では確率ブーリアンネットワークと呼ばれるシステムの表現を用いて,システムの確率的不確かさに着目して最適化アルゴリズムの検討を行ってきたが,ブーリアンネットワークは離散値をとるモデルであった.この点に対して,連続値をとるシステムのモデルとして,インパルス応答とそのガウス過程回帰による推定に着目して研究を行った.具体的には,システムのインパルス応答系列をガウス過程回帰によって推定する手法を用いて,ある目標となる出力に追従するような制御入力系列を求める反復学習制御への適用の検討を行った.
|