確率システムのデータ駆動型学習最適制御

研究課題

研究課題/領域番号	18H05899
研究種目	研究活動スタート支援
配分区分	補助金
審査区分	0301:材料力学、生産工学、設計工学、流体工学、熱工学、機械力学、ロボティクス、航空宇宙工学、船舶海洋工学およびその関連分野
研究機関	統計数理研究所
研究代表者	豊田充統計数理研究所, 統計思考院, 特任助教 (40826939)
研究期間 (年度)	2018-08-24 – 2020-03-31
研究課題ステータス	完了 (2018年度)
配分額 *注記	2,340千円 (直接経費: 1,800千円、間接経費: 540千円) 2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード	制御理論 / 最適制御 / 確率システム / 論理システム / 離散システム / ブーリアンネットワーク / ベイズ最適化 / 有限時間最適制御
研究実績の概要	本研究課題では動的システムを対象として，観測されたデータをもとに，制御対象のダイナミクスや評価関数を学習しながら最適化するアルゴリズムの研究を実施した．具体的な制御対象としては，微分方程式で表される連続時間のダイナミクスと離散的な論理状態を確率的に遷移する確率論理システムに焦点をあて検討を行った． (1) 連続時間微分方程式であらわされるダイナミクスを対象とした研究に関しては，従来静的関数の最適化に用いられていたガウシアンプロセスによるベイズ的最適化手法を最適制御問題に拡張し，有限時間最適制御問題をデータ駆動的に最適化する方法を得た．さらに動的システム論の知見を活用した効率的な評価関数の勾配計算手法によって計算の実現可能性を示し，また，アルゴリズムの適用によって達成される最適性に関しても評価を行った． (2) 2値の離散的な論理状態をとり，それらが確率的な遷移に従う確率論理システムである確率ブーリアンネットワークについて，基礎的な結果としてモデル内の確率を得られた計測データからベイズ的に推定する手法が得られた．また，従来ではモデル内の選択確率とよばれるパラメータは確定的に与えられ制御問題が定式化されていたが，確率的に不確かな選択確率をもつ最適制御問題として新たな問題設定を行い，推定を行いながら最適制御するアルゴリズムを検討した．付随的な結果として，従来の可制御性の検討を最適制御問題として取り扱う手法を考案し，従来研究よりも広い枠組みで可制御性が議論できることを示した．
現在までの達成度 (段落)	平成30年度が最終年度であるため、記入しない。
今後の研究の推進方策	平成30年度が最終年度であるため、記入しない。

報告書

(1件)

2018 実績報告書

研究成果
(7件)

すべて 2019 2018 その他

すべて国際共同研究 (1件) 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (5件) (うち国際学会 2件)

[国際共同研究] 大連理工大学(中国)
- 関連する報告書
  2018 実績報告書
[雑誌論文] 未知評価関数を有する連続時間最適制御問題におけるベイズ的最適化手法2019
- 著者名/発表者名
  豊田充
- 雑誌名
  
  計測自動制御学会論文集
  
  巻: 55 号: 2 ページ: 100-109
- DOI
  10.9746/sicetr.55.100
- NAID
  130007601712
- ISSN
  0453-4654, 1883-8189
- 関連する報告書
  2018 実績報告書
- 査読あり
[学会発表] MCMC Based Selection Probability Estimation2019
- 著者名/発表者名
  Mitsuru Toyoda and Yuhu Wu
- 学会等名
  2019 12th Asian Control (ASCC)
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] Terminal Cost Optimization of Probabilistic Boolean Control Network with Beta Distributed Selection Probabilities2019
- 著者名/発表者名
  Mitsuru Toyoda and Yuhu Wu
- 学会等名
  38th Chinese Control Conference (CCC2019)
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] HEVの最適エネルギマネジメント問題の近似解法2019
- 著者名/発表者名
  豊田充，徐福国，申鉄龍
- 学会等名
  自動車技術会2019年春季大会
- 関連する報告書
  2018 実績報告書
[学会発表] 確率ブーリアンネットワークの有限時間到達確率最大化制御2018
- 著者名/発表者名
  豊田充，呉玉虎
- 学会等名
  第61回自動制御連合講演会講演論文集
- 関連する報告書
  2018 実績報告書
[学会発表] パラメータがベータ事前分布に従う確率ブーリアンネットワークの最適制御2018
- 著者名/発表者名
  豊田充，呉玉虎
- 学会等名
  第6回制御部門マルチシンポジウム講演論文集(第10回プラントモデリングシンポジウム)
- 関連する報告書
  2018 実績報告書

確率システムのデータ駆動型学習最適制御

研究代表者

豊田 充 統計数理研究所, 統計思考院, 特任助教 (40826939)

2,340千円 (直接経費: 1,800千円、間接経費: 540千円)

報告書

研究成果

[国際共同研究] 大連理工大学(中国)

関連する報告書

[雑誌論文] 未知評価関数を有する連続時間最適制御問題におけるベイズ的最適化手法2019

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] MCMC Based Selection Probability Estimation2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Terminal Cost Optimization of Probabilistic Boolean Control Network with Beta Distributed Selection Probabilities2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] HEVの最適エネルギマネジメント問題の近似解法2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] 確率ブーリアンネットワークの有限時間到達確率最大化制御2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] パラメータがベータ事前分布に従う確率ブーリアンネットワークの最適制御2018

著者名/発表者名

学会等名

関連する報告書

豊田充統計数理研究所, 統計思考院, 特任助教 (40826939)