2014 年度実施状況報告書

離散事象アプローチに基づく定量的リスク保証型最適スーパバイザ制御機構の構築

研究課題

研究課題/領域番号	25870945
研究機関	摂南大学
研究代表者	山崎達志摂南大学, 理工学部, 准教授 (00368458)
研究期間 (年度)	2013-04-01 – 2016-03-31
キーワード	制御工学 / 離散事象システム / スーパバイザ制御 / 最適制御 / リスク / 強化学習
研究実績の概要	スーパバイザ制御は離散事象システムに対する代表的な制御法であり，制御器であるスーパバイザが，生起を許可する事象の集合(制御パターン)を指定することで，システムの振る舞いを制御する。本年度は，定量的リスク保証型最適スーパバイザ制御を，大規模複雑な離散事象システムを陽に考慮して行うための方策を中心に研究した。大規模で時変な離散事象システムを対象にしたスーパバイザ制御として，先読み戦略によりシステムの振る舞いを予測したうえで，これに対し制御器を構成するLLPスーパバイザ制御が提案されている。本研究では，確率離散事象システムでモデル化した複数のローカルシステムから構成されるシステムを対象として考える。また，その構成が動的に変化することもあり，事象の生起や禁止にはコストがかかるとした。システム全体の振る舞いを先読み戦略により予測し，LLPスーパバイザ制御によりシステムの振る舞いを論理的な制御仕様を満たすよう制限するとともに，制御パターンに対する評価値を動的計画法に基づく評価関数により構成した。これにより，与えられた論理的な制御仕様を満たした上でコストを考慮した最適LLPスーパバイザ制御を提案した。さらに，コスト情報と遷移モデルを強化学習により推定することで，不確かな環境に対応するスーパバイザの学習アルゴリズムを示した。また，計算機実験により有効性の検討を行った。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由平成26年度の主目的は，対象となるシステムを大規模複雑な離散事象システムとして陽に考慮した最適スーパバイザ制御について検討することであった。LLP(Limited Lookahead Policy)型スーパバイザ制御を，前年までの研究成果に導入することで，大規模離散事象システムに対する最適スーパバイザの記述モデルと設計法について示せたことから，おおむね順調に進展していると考えている。
今後の研究の推進方策	平成27年度は本研究課題の最終年度であり，これまでの研究成果を統合することで，不確かな環境下にある大規模離散事象システムに対し先読み戦略を適用し，定量的リスク保証と最適スーパバイザ制御を統合した，新たなスーパバイザ制御の枠組みを完成させる。また，計算機上の実験だけでなく，実ロボットなどを使用しての実環境での提案手法の評価により，研究成果の有用性を明らかにする。
次年度使用額が生じた理由	ソフトウェアのライセンス更新費用を一部次年度に回したことと，既存の計算機環境を活用したために，計算機実験の際に追加の計算機部品の購入を見送ったことが主な理由である。
次年度使用額の使用計画	研究に使用するソフトウェアのライセンス更新および，制御関連図書，計算機実験用の計算機部品を購入する。また，本年度は研究成果の海外の国際会議での発表を予定しており，旅費及び参加費が前年度より大きく増加する見込みである。

研究成果
(2件)

すべて 2015 2014

すべて雑誌論文 (2件) (うち謝辞記載あり 2件)

[雑誌論文] 状態遷移モデルの学習に基づく最適LLPスーパバイザの構成2015
- 著者名/発表者名
  梅本聖, 山崎達志
- 雑誌名
  
  電子情報通信学会技術研究報告(MSS)
  
  巻: Vol.114, No.493 ページ: 7-12
- 謝辞記載あり
[雑誌論文] 強化学習を用いた離散事象システムの最適LLPスーパバイザ制御について2014
- 著者名/発表者名
  梅本聖, 山崎達志
- 雑誌名
  
  電子情報通信学会技術研究報告(MSS)
  
  巻: Vol.113, No.313 ページ: 135-140
- 謝辞記載あり