研究課題/領域番号 |
25870945
|
研究機関 | 摂南大学 |
研究代表者 |
山崎 達志 摂南大学, 理工学部, 准教授 (00368458)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 制御工学 / 離散事象システム / スーパバイザ制御 / 最適制御 / リスク / 強化学習 |
研究実績の概要 |
スーパバイザ制御は離散事象システムに対する代表的な制御法であり,制御器であるスーパバイザが,生起を許可する事象の集合(制御パターン)を指定することで,システムの振る舞いを制御する。本年度は,定量的リスク保証型最適スーパバイザ制御を,大規模複雑な離散事象システムを陽に考慮して行うための方策を中心に研究した。 大規模で時変な離散事象システムを対象にしたスーパバイザ制御として,先読み戦略によりシステムの振る舞いを予測したうえで,これに対し制御器を構成するLLPスーパバイザ制御が提案されている。本研究では,確率離散事象システムでモデル化した複数のローカルシステムから構成されるシステムを対象として考える。また,その構成が動的に変化することもあり,事象の生起や禁止にはコストがかかるとした。システム全体の振る舞いを先読み戦略により予測し,LLPスーパバイザ制御によりシステムの振る舞いを論理的な制御仕様を満たすよう制限するとともに,制御パターンに対する評価値を動的計画法に基づく評価関数により構成した。これにより,与えられた論理的な制御仕様を満たした上でコストを考慮した最適LLPスーパバイザ制御を提案した。さらに,コスト情報と遷移モデルを強化学習により推定することで,不確かな環境に対応するスーパバイザの学習アルゴリズムを示した。また,計算機実験により有効性の検討を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成26年度の主目的は,対象となるシステムを大規模複雑な離散事象システムとして陽に考慮した最適スーパバイザ制御について検討することであった。LLP(Limited Lookahead Policy)型スーパバイザ制御を,前年までの研究成果に導入することで,大規模離散事象システムに対する最適スーパバイザの記述モデルと設計法について示せたことから,おおむね順調に進展していると考えている。
|
今後の研究の推進方策 |
平成27年度は本研究課題の最終年度であり,これまでの研究成果を統合することで,不確かな環境下にある大規模離散事象システムに対し先読み戦略を適用し,定量的リスク保証と最適スーパバイザ制御を統合した,新たなスーパバイザ制御の枠組みを完成させる。また,計算機上の実験だけでなく,実ロボットなどを使用しての実環境での提案手法の評価により,研究成果の有用性を明らかにする。
|
次年度使用額が生じた理由 |
ソフトウェアのライセンス更新費用を一部次年度に回したことと,既存の計算機環境を活用したために,計算機実験の際に追加の計算機部品の購入を見送ったことが主な理由である。
|
次年度使用額の使用計画 |
研究に使用するソフトウェアのライセンス更新および,制御関連図書,計算機実験用の計算機部品を購入する。また,本年度は研究成果の海外の国際会議での発表を予定しており,旅費及び参加費が前年度より大きく増加する見込みである。
|