データ活用制御手法の信頼性向上にむけた確率雑音の効用解析
Project/Area Number |
21J14577
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Review Section |
Basic Section 21040:Control and system engineering-related
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
伊藤 海斗 東京工業大学, 情報理工学院, 助教
|
Project Period (FY) |
2021-04-28 – 2023-03-31
|
Project Status |
Completed (Fiscal Year 2022)
|
Budget Amount *help |
¥1,500,000 (Direct Cost: ¥1,500,000)
Fiscal Year 2022: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2021: ¥800,000 (Direct Cost: ¥800,000)
|
Keywords | 最適制御 / 最適輸送 / 機械学習 / エントロピー / 振動子 / プライバシー / 確率システム |
Outline of Research at the Start |
本研究の目的は、実データを活用する制御手法を信頼して使えるようにするための理論基盤を与えることである。具体的には(1)機械学習を利用した制御手法の信頼性向上、(2)データ活用制御手法におけるプライバシー保護、に取り組む。 (1)について、機械学習のロバスト化のために利用されている確率雑音が、制御システムにおける学習にもたらす効果をロバスト制御理論の観点から明らかにする。 (2)について、制御システム中の個人情報を含んだ信号を保護するために確率雑音を用いる。特に信号の急激な変動を隠蔽することを考え、外れ値が稀に生じる雑音(安定分布雑音)を活用することが本研究の特徴である。
|
Outline of Annual Research Achievements |
確率雑音が制御システムにおける学習にもたらす効用解析を目的として,最適制御におけるエントロピー正則化の研究に取り組んだ.離散時間線形システムの初期状態分布と目標分布がガウス分布で与えられたときに,終端時刻で状態分布を目標分布に一致させる制御問題を考えた.制御コストを二次形式と制御方策のエントロピー正則化項で与えたとき,コスト最小化解が陽に与えられることを示した.さらにその解がエントロピー正則化最適輸送問題の最適解を与えることを示した.エントロピー正則化は強化学習・最適輸送において,そして分布のダイナミクスは生成モデル(拡散モデル)において注目されており,最適制御を通してこれらをつなげる興味深い結果が得られたといえる. また分布ダイナミクスに関連して,多数の振動子から成る群を一つの確率分布でモデリングし,振動子全体に共通の制御入力を与えることで振動子分布を目標分布へ収束させる問題に取り組んだ.振動子が雑音に駆動される場合,振動子分布を目標分布と完全に一致させることは一般にできない課題があった.そこで本研究では,L2距離の意味で目標分布の近くに留まる振動子分布の軌道を最適化で設計,そしてその軌道へ振動子分布が任意の初期分布から収束できる制御方策を設計するアプローチを提案した.さらに提案法の収束性を証明した. また,エントロピー正則化と同様に制御方策の確率性を促進させる「Kullback-Leibler(KL)制御問題」を考察した.従来のKL制御は遷移分布の可制御性に関する仮定をおくことで,最適解が効率的に計算できることが知られていたが,状態空間が連続な場合,その仮定は非現実的なものであった.そこで本研究ではKL制御の定式化を適切に修正することで,連続状態空間における非現実的な仮定の除去ができ,連続空間においてもKL制御の利点が享受できるようになった.
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(12 results)