2023 Fiscal Year Research-status Report

「足るを知れる」データ駆動型システム設計論：どこまで把握/制御/保護できるか

Research Project

Project/Area Number	22K14276
Research Institution	The University of Electro-Communications
Principal Investigator	定本知徳電気通信大学, 大学院情報理工学研究科, 准教授 (40839966)
Project Period (FY)	2022-04-01 – 2025-03-31
Keywords	データ駆動制御 / 方策勾配法
Outline of Annual Research Achievements	昨年度までの成果により，データから対象システムを「知れる」ためのデータ量と対象システムを制御するためのデータ量が，データが十分に存在するとき，ある意味で等価であることが明らかとなった．では，データが十分でない場合に，対象システムを制御するためにはどのようにすればよいだろうか．この視点に立ち，本年度は，逐次的に動的出力フィードバック制御器を学習する方策勾配法とその解析を与えた．本手法も，昨年度の研究で導入したVARXモデルに基づくものである．これにより，動的出力フィードバック制御器設計が入出力データの有限長の履歴を擬似的な状態とみなした状態フィードバック制御器設計へと等価に変換できることを示している．つぎにこの等価性に基づき，モデルベースな方策勾配法を提案し，大域的最適解に線形収束することを示した．これは，最適制御問題に近しい評価関数の最小化問題として定式化されており，その問題が非凸でありつつもPolyak-Lojasiewicz不等式を満たすため，単純な勾配アルゴリズムによって1次の速度で大域的最適解に収束することが保証されている．さらに，勾配のモンテカルロ近似に基づくモデルフリー型の方策勾配を提案し，そのサンプル複雑性解析も与えている．同様の解析は状態フィードバック制御器設計の場合において行われておりその解析と大差はないものの，同様の解析結果が出力フィードバック制御器設計の場合へも自然に拡張できることを示している点で重要であると考えられる．提案法の有効性は数値シミュレーションによって検証している．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 昨年度までの研究成果を踏まえて新たな問いを提案し，それに対する一つの解が得られたため．
Strategy for Future Research Activity	提案した動的出力フィードバック制御器を学習する手法は，対象が線形システムに限定されていることに加え，データにノイズが混入しない状況に限定されているという問題点がある．これらの問題を解決するように，提案法を拡張していくことが今後の重要な課題である．

Research Products
(1 results)

All Presentation (1 results)

[Presentation] 動的出力フィードバック制御器設計のための観測ノイズ下における方策勾配法2023
- Author(s)
  平井卓実, 定本知徳
- Organizer
  第10回制御部門マルチシンポジウム