「足るを知れる」データ駆動型システム設計論:どこまで把握/制御/保護できるか
Project/Area Number |
22K14276
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 21040:Control and system engineering-related
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
定本 知徳 電気通信大学, 大学院情報理工学研究科, 准教授 (40839966)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2024: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
|
Keywords | データ駆動制御 / 方策勾配法 / システム同定 / 制御理論 / データ駆動型システム設計論 |
Outline of Research at the Start |
データ×AIを核として経済発展と社会的課題解決の両立を目指すデータ駆動型社会の実現に向けた取り組みが進んでいます.しかし,こうした取り組みの多くは大量のデータが入手できることを前提としており,データ量の追求に偏るデータ資本主義的なシステム設計論は格差・分断社会を誘発しかねません.本研究では,「データ量」と「達成すべき仕様」を天秤にかけられる新しいシステム設計論の構築を目指します.
|
Outline of Annual Research Achievements |
昨年度までの成果により,データから対象システムを「知れる」ためのデータ量と対象システムを制御するためのデータ量が,データが十分に存在するとき,ある意味で等価であることが明らかとなった.では,データが十分でない場合に,対象システムを制御するためにはどのようにすればよいだろうか. この視点に立ち,本年度は,逐次的に動的出力フィードバック制御器を学習する方策勾配法とその解析を与えた.本手法も,昨年度の研究で導入したVARXモデルに基づくものである.これにより,動的出力フィードバック制御器設計が入出力データの有限長の履歴を擬似的な状態とみなした状態フィードバック制御器設計へと等価に変換できることを示している.つぎにこの等価性に基づき,モデルベースな方策勾配法を提案し,大域的最適解に線形収束することを示した.これは,最適制御問題に近しい評価関数の最小化問題として定式化されており,その問題が非凸でありつつもPolyak-Lojasiewicz不等式を満たすため,単純な勾配アルゴリズムによって1次の速度で大域的最適解に収束することが保証されている.さらに,勾配のモンテカルロ近似に基づくモデルフリー型の方策勾配を提案し,そのサンプル複雑性解析も与えている.同様の解析は状態フィードバック制御器設計の場合において行われておりその解析と大差はないものの,同様の解析結果が出力フィードバック制御器設計の場合へも自然に拡張できることを示している点で重要であると考えられる.提案法の有効性は数値シミュレーションによって検証している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度までの研究成果を踏まえて新たな問いを提案し,それに対する一つの解が得られたため.
|
Strategy for Future Research Activity |
提案した動的出力フィードバック制御器を学習する手法は,対象が線形システムに限定されていることに加え,データにノイズが混入しない状況に限定されているという問題点がある.これらの問題を解決するように,提案法を拡張していくことが今後の重要な課題である.
|
Report
(2 results)
Research Products
(4 results)