2019 Fiscal Year Research-status Report
確率分布のダイナミクスに基づいた確率制御手法の高度化
Project/Area Number |
18K13779
|
Research Institution | Kyoto University |
Principal Investigator |
星野 健太 京都大学, 情報学研究科, 助教 (10737498)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 制御理論 / 確率システム / 非線形制御理論 / 最適輸送理論 |
Outline of Annual Research Achievements |
本研究は,制御理論に基づき,確率システムが持つ分布のダイナミクスの性質を明らかにすることを目的としている.その背景には,確定的な場合とは異なり,確率的な動的システムにはその確率的な不確かさを解析したり,制御したりするための手法が十分には開発されていないことがある.このような目的のもと,本年度は以下のような研究を行った. 一つ目の成果としては,確率システムの確率分布の時間変化について,所望の挙動を可能な限り実現する制御手法を確立したことである.具体的には,最適輸送理論に基づいた制御手法や,Wasserstein距離と呼ばれる確率分布間の距離を考えた最適制御問題の定式化と最適性条件を示した.さらに,後者については数値計算手法も示した.これにより,ガウス分布などの基本的な分布を仮定する標準的な問題設定よりも多様なクラスの確率分布を考慮した制御ができるようになる.また,得られた制御手法と機械学習のある手法との関連性を見出すことができ,応用につながる成果が得られた. また,もう一つの成果としては,漸近安定性,漸近安定化問題に関する結果が挙げられる.確率有限時間整定と呼ばれる問題において,確率分布の動特性を解析するための基礎として,密度関数と呼ばれる関数を用いた安定性解析の研究を行った.従来,確率システムの安定性や安定化において,リャプノフ安定論と呼ばれる理論に基づいて安定性を解析することが一般的であったが,確率システムについては,過渡的な挙動で生じる確率的な変動を考慮することが難しい.特に,有限時間整定問題では,整定時間が小さくなることが望ましいが,整定時間が確率変数となるため,その確率分布を解析することが望まれている.本年度に得られた結果は,そのような解析を可能にするための基礎となる結果である.また,確率システムの漸近的な挙動として,有界性についても研究を行い,その条件を示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の最終的な目的は,確率システムの様々な制御問題で必要となる確率分布のダイナミクスの解析や制御を可能にすることである.本課題ではそのために,確率分布のダイナミクスの漸近的な挙動の解析や制御手法,および,確率分布の可到達性や可制御性の解析などに取り組んでいる.また,それらの成果を制御問題の一種である有限時間整定制御問題や機械学習の手法への応用することも目的としている. 本年度までに,上述の課題のうち,確率分布の解析および制御手法を最適輸送理論に基づいて開発することができた.特に,Wasserstein距離を評価汎関数とする最適制御問題に取り組んでおり,その基礎的な最適性条件を明らかにすることができた.この結果に基づいて確率分布の可到達性や可制御性の性質を明らかにするための見通しも得られている.また,機械学習への応用の目処もついていることから,確率分布の解析,制御手法について,ほぼ予定していた通りの成果が得られている. また,確率分布のダイナミクスの解析に関する別の成果として,密度関数を用いた解析手法や有界性の研究に取り組んだ.特に有界性の研究に関しては,スピード測度などを導入した手法を示すことで,新たな解析のアプローチを示すことができており,一定の成果が得られていると言える.残りの課題は,確率分布からさらに詳細な情報を抽出することを可能にし,それらの成果を確率有限時間整定に応用することであり,従来は不可能であった整定時間の確率分布の解析を実現することである.この課題については最終年度である次年度に取り組むことにしている. 上記のような成果が得られていることから,一部については遅れが見られるものの,全体的にはおおむね順調に進展しているものと判断した.
|
Strategy for Future Research Activity |
現在までの進捗状況をふまえて,今後は以下のように研究を推進することを予定している. 確率分布の制御手法に関しては,Wasserstein距離を評価汎関数とする最適制御問題の枠組みで研究を進めており,これまでのところ,離散時間システムに対する制御手法を開発することができている.今後は連続時間システムを対象とした制御手法の開発が課題となる.この課題に関しては,離散時間システムの制御問題に取り組んだことにより,評価汎関数を別の表現に変換することによって,最適制御の基本的なアプローチが利用できることが判明しており,連続時間システムの場合についても同様のアプローチが可能であると予想している.また,それらの成果を機械学習のある手法に応用できることが判明しているため,提案手法の応用を示し,その有効性を評価する.さらに,確率システムの分布が取りうる値を解析することにより,確率分布の可制御性の解析手法を確立する.また,確率ノイズが制御系の性能をどの程度劣化させるかを解析する手法を開発することにも取り組む. また,確率分布の動特性の解析に関しては,確率システムの状態量が指定された領域へ到達する確率とその到達時間の確率の評価手法を開発する.類似の問題として,確率微分方程式の解の有限時間爆発の爆発時間の確率分布の研究が知られているため,その知見を導入することにより,有限時間整定における整定時間の解析が可能になると見込んでいる.整定時間の確率的な解析が可能になることで,異なる有限時間整定制御則について,どちらがより早く整定する確率が大きいかといったことを評価することが可能になる.これにより,多数存在する有限時間整定制御則の設計法について,その優劣を判定することができるようになると見込んでおり,その評価も行う.
|
Causes of Carryover |
本年度はほぼ予定していた額を使用したが,前年度に生じた残額が大きく,その分が次年度使用額として生じている.これは初年度にコンピュータ等の物品の購入について検討した結果,購入を見送ったためである.次年度は,研究の進展に伴い,論文の投稿費用,英文校閲費用の支出が見込まれるため,次年度使用額をそれらの支出に充てる予定である.また,研究の進展によっては高度な計算機環境が必要になることが見込まれるため,計算機の購入を検討している.
|