研究課題/領域番号 |
18H05899
|
研究種目 |
研究活動スタート支援
|
配分区分 | 補助金 |
審査区分 |
0301:材料力学、生産工学、設計工学、流体工学、熱工学、機械力学、ロボティクス、航空宇宙工学、船舶海洋工学およびその関連分野
|
研究機関 | 統計数理研究所 |
研究代表者 |
豊田 充 統計数理研究所, 統計思考院, 特任助教 (40826939)
|
研究期間 (年度) |
2018-08-24 – 2020-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 制御理論 / 最適制御 / 確率システム / 論理システム / 離散システム / ブーリアンネットワーク / ベイズ最適化 / 有限時間最適制御 |
研究実績の概要 |
本研究課題では動的システムを対象として,観測されたデータをもとに,制御対象のダイナミクスや評価関数を学習しながら最適化するアルゴリズムの研究を実施した.具体的な制御対象としては,微分方程式で表される連続時間のダイナミクスと離散的な論理状態を確率的に遷移する確率論理システムに焦点をあて検討を行った. (1) 連続時間微分方程式であらわされるダイナミクスを対象とした研究に関しては,従来静的関数の最適化に用いられていたガウシアンプロセスによるベイズ的最適化手法を最適制御問題に拡張し,有限時間最適制御問題をデータ駆動的に最適化する方法を得た.さらに動的システム論の知見を活用した効率的な評価関数の勾配計算手法によって計算の実現可能性を示し,また,アルゴリズムの適用によって達成される最適性に関しても評価を行った. (2) 2値の離散的な論理状態をとり,それらが確率的な遷移に従う確率論理システムである確率ブーリアンネットワークについて,基礎的な結果としてモデル内の確率を得られた計測データからベイズ的に推定する手法が得られた.また,従来ではモデル内の選択確率とよばれるパラメータは確定的に与えられ制御問題が定式化されていたが,確率的に不確かな選択確率をもつ最適制御問題として新たな問題設定を行い,推定を行いながら最適制御するアルゴリズムを検討した.付随的な結果として,従来の可制御性の検討を最適制御問題として取り扱う手法を考案し,従来研究よりも広い枠組みで可制御性が議論できることを示した.
|
現在までの達成度 (段落) |
平成30年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
平成30年度が最終年度であるため、記入しない。
|