研究課題/領域番号 |
22K14276
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分21040:制御およびシステム工学関連
|
研究機関 | 電気通信大学 |
研究代表者 |
定本 知徳 電気通信大学, 大学院情報理工学研究科, 准教授 (40839966)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2024年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | データ駆動制御 / 方策勾配法 / システム同定 / 制御理論 / データ駆動型システム設計論 |
研究開始時の研究の概要 |
データ×AIを核として経済発展と社会的課題解決の両立を目指すデータ駆動型社会の実現に向けた取り組みが進んでいます.しかし,こうした取り組みの多くは大量のデータが入手できることを前提としており,データ量の追求に偏るデータ資本主義的なシステム設計論は格差・分断社会を誘発しかねません.本研究では,「データ量」と「達成すべき仕様」を天秤にかけられる新しいシステム設計論の構築を目指します.
|
研究実績の概要 |
昨年度までの成果により,データから対象システムを「知れる」ためのデータ量と対象システムを制御するためのデータ量が,データが十分に存在するとき,ある意味で等価であることが明らかとなった.では,データが十分でない場合に,対象システムを制御するためにはどのようにすればよいだろうか. この視点に立ち,本年度は,逐次的に動的出力フィードバック制御器を学習する方策勾配法とその解析を与えた.本手法も,昨年度の研究で導入したVARXモデルに基づくものである.これにより,動的出力フィードバック制御器設計が入出力データの有限長の履歴を擬似的な状態とみなした状態フィードバック制御器設計へと等価に変換できることを示している.つぎにこの等価性に基づき,モデルベースな方策勾配法を提案し,大域的最適解に線形収束することを示した.これは,最適制御問題に近しい評価関数の最小化問題として定式化されており,その問題が非凸でありつつもPolyak-Lojasiewicz不等式を満たすため,単純な勾配アルゴリズムによって1次の速度で大域的最適解に収束することが保証されている.さらに,勾配のモンテカルロ近似に基づくモデルフリー型の方策勾配を提案し,そのサンプル複雑性解析も与えている.同様の解析は状態フィードバック制御器設計の場合において行われておりその解析と大差はないものの,同様の解析結果が出力フィードバック制御器設計の場合へも自然に拡張できることを示している点で重要であると考えられる.提案法の有効性は数値シミュレーションによって検証している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度までの研究成果を踏まえて新たな問いを提案し,それに対する一つの解が得られたため.
|
今後の研究の推進方策 |
提案した動的出力フィードバック制御器を学習する手法は,対象が線形システムに限定されていることに加え,データにノイズが混入しない状況に限定されているという問題点がある.これらの問題を解決するように,提案法を拡張していくことが今後の重要な課題である.
|