Integration of control and inference in stochastic control
Project/Area Number |
23K03902
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 21040:Control and system engineering-related
|
Research Institution | Kyoto University |
Principal Investigator |
星野 健太 京都大学, 情報学研究科, 助教 (10737498)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2025: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
Keywords | 確率制御 / 非線形制御 / 非線形フィルタリング / 確率推論 / 制御理論 |
Outline of Research at the Start |
本研究課題では,確率的かつ動的なシステムを制御の対象として,その対象に関する情報が制限される状況での制御問題に取り組む.このような問題においてシステムを制御するためには,入手できない情報を推定することが必要となる.本課題では,ベイズ推定や近年の深層学習の発展に見られる確率的な推定の手法を制御理論に取り入れることによってより柔軟な制御手法を開発することを目指す.
|
Outline of Annual Research Achievements |
本研究課題は,確率的な推論を制御に取り入れることで,確率的な制御問題における不確実性や情報を柔軟に扱う新しい制御の枠組みを開発することを目的としている.従来の制御理論では,確率的な環境下での問題を扱う枠組みとして,線形制御工学に基づく線形フィルタリングや制御手法が基礎とされてきた.しかし,これらの線形的な手法は,非線形性を有するシステムに適用すると性能が不十分であることが多い.この原因は,制御システムの線形性が前提されていることに加え,扱う確率的な現象の範囲が正規分布に限定されているためである.現実の多くのシステムには何らかの非線形性が含まれ,かつその非線形性に起因して確率的な現象が正規分布ではないより複雑な分布で記述される.本研究では,制御対象が非線形であり,確率的な現象が正規分布に限らない一般的な場合に対する制御手法を確立することを目指す.具体的には,確率的な環境下での状態や環境を推定しながら制御を行うための最適制御理論とアルゴリズムの開発に焦点を当てる. 初年度である今年度は,上述の確率的な環境における最適制御問題に対する基礎理論として,確率分布を制御対象とした問題について確率分布を所望の確率分布へと制御する制御問題に取り組み,その最適性条件を導出した.この結果では,制御系が連続時間の非線形確率システムで与えられる場合の最適性条件を導出した.この最適性条件は最小原理と呼ばれる最適制御理論の枠組みに基づいており,モデル予測制御などの手法との親和性が高いものとなっている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は確率的な推論を取り入れた制御の枠組みを開発するために,ベイズ推定などの確率的な推論を制御に取り入れることを目的としている.このような枠組みの基礎となるのが,従来からシステムの状態量の推定などに使われてきたフィルタリングである.フィルタリングはより抽象的な観点からはベイズ推定をリアルタイムに行うものとみなせる.線形フィルタリングは,分布を正規分布に限定することで,平均と共分散行列の有限次元のパラメータを推定する問題となる.一方,非線形系かつ一般的な確率分布の場合には,一般には無限次元の対象である確率分布を陽に扱うことが要求される.これは線形系を対象とした場合とは大きく異なる.そして,推論と制御を同時に行うためには,推論の結果を記述する確率分布を所望の分布となるように制御する問題を考える必要がある.
本年度は推論と制御のうち,制御に重点を置いた研究を行った.具体的には,推論の結果として得られた確率分布が与えられているという前提の元でその確率分布を制御する問題に取り組んだ.扱った問題は最適制御問題である.ここでは確率分布が制御の対象となっており,それを制御する問題となっている.このような問題では,確制御の良さを判定するために,確率分布の汎函数を最適制御の指標に用いる必要がある.この問題について,本年度は制御系が非線形確率微分方程式で記述され,その状態変数の確率分布を制御する問題を対象として最適条件を導出した.ポントリャーギンの最小原理と呼ばれる最適制御理論で基礎となっている条件を確率分布を制御する制御問題に拡張する形で条件を導出した.最小原理は非線形モデル予測制御手法の開発の基礎となることが多く,モデル予測制御をはじめとする手法の開発につながる.また,最小原理は近年のニューラルODEと呼ばれる機械学習のモデリング手法の基礎ともなっており,モデリング手法への応用も期待できる.
|
Strategy for Future Research Activity |
本年度は制御の側面に着目した研究を行った.次年度以降はフィルタリング理論などのベイズ推定の枠組みとの融合を目指す.また,モデル予測制御的なアルゴリズムの開発に取り組む.
|
Report
(1 results)
Research Products
(2 results)