2017 Fiscal Year Research-status Report
場面遷移ネットを用いた大規模産業システムのモデル化・評価手法
Project/Area Number |
16K06198
|
Research Institution | Aichi University of Technology |
Principal Investigator |
舘山 武史 愛知工科大学, 工学部, 教授(移行) (70336527)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 情報システム / 大規模システム / 離散・連続混合システム / 場面遷移ネット / モデリング / シミュレーション / 強化学習 / system of systems |
Outline of Annual Research Achievements |
まず場面遷移ネットのモデル記述能力の向上を目的として,下記のような拡張を行った.大規模・複雑なシステム,特に人間のふるまいがシステムの挙動に影響するシステムでは,人間のふるまいのモデル化が重要となる.人間のふるまいは現場の状況,人間の嗜好や体調等,様々な要素の影響により不確定であるため予測が困難であり,不確定な確率的事象としてモデル化する必要が生じる場合が多い.しかし,それらの確率関数・確率分布は常に一定ではなく,「状況」によって変動する場合がある.このようなシステムは,隠れマルコフモデル(HMM)の概念を用いてモデル化が可能である.このようなモデルを場面遷移ネットモデルに組み込むことができれば,隠れ状態をもつシステムの挙動の検証が可能となる.そこで本研究では,HMMの構造を含むシステムモデルを構築可能とするように場面遷移ネットを拡張し,シミュレーションによってその挙動を観測可能とした. また,大規模システムの最適化を行う手法の一つとして,下記のような学習アルゴリズムを開発した.大規模環境における強化学習の高速化を実現する手法として,複数のエージェントで学習経験を共有する手法が有効であることが知られている.これらの手法の一つとして舘山らは,「探索に集中するエージェント」と「報酬獲得に集中するエージェント」の2種類のエージェントを設定し,効率的かつ高い確率で最適解の獲得を可能とする手法を提案している.しかし本手法を大規模問題に適用する場合,複数のエージェントの探索行動の重複が生じ,結果としてシステム全体の探索効率悪化の原因となる可能性がある.そこで本研究では,より大規模な環境において効率的な強化学習を可能とすることを目的として,個々のエージェントにそれぞれ異なる「優先的に探索すべき状態」をあらかじめ指定する手法を提案し,探索行動の重複を減少させることを可能とした.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
初年度終了時の目標であった仮想的な大規模施設のモデリング・シミュレーションを可能とするためには,場面遷移ネットの拡張が必要となり,平成29年度の序盤は拡張方法および実装方法の提案・検証に重点を置いた.また,システムの最適化アルゴリズムも,当初予定していた遺伝アルゴリズム等の既存手法に加え,強化学習等の様々な手法を適用する必要性が生じ,独自のマルチエージェント強化学習アルゴリズムの開発を行うこととした.次年度はこれらの成果を用い,大規模施設のモデリング・シミュレーションを行い,提案するシミュレーション手法の有効性を検証する.
|
Strategy for Future Research Activity |
最終年度となる平成30年度は,前年度までの研究成果となる,拡張した場面遷移ネットおよび最適化手法を用いて,実在の大型機械のメンテナンス現場をモデルとした仮想的な大規模施設を想定した問題設定によって提案手法の有効性を確認する.本研究は,市販シミュレータ,自作のシステム最適化プログラムおよび場面遷移ネットを連携させ,大規模システムのモデル化,シミュレーションおよび最適化を目指すものである.具体的には,実在の大型機械のメンテナンス現場を基とした仮想的な大規模施設を想定し,場面遷移ネットおよび複数のシミュレータを組み合わせ,モデリングおよびシミュレーションを行う.同時に,MATLABとGPGPUを導入したシミュレーションシステムによって,場面遷移ネットの演算の高速化を実現する.また,開発中のシミュレーションシステムに,遺伝アルゴリズムやマルチエージェント強化学習などの最適化プログラムを実装し,多数の評価軸の観点からスケジュール,レイアウト等の最適化を実現することを目指す.
|
Causes of Carryover |
(理由) 前述の通り,初年度終了時の目標であった仮想的な大規模施設のモデリング・シミュレーションを可能とするためには,さらなるモデリング・シミュレーション手法の拡張および最適化手法の開発が不可欠となり,平成29年度の一定期間は,シミュレータの構築・検証の研究よりも,アルゴリズムの開発を中心とする研究に重きを置く方針に切り替えた.そのため,シミュレータ構築のための一部の計算機周辺機器およびソフトウェアの購入を見合わせた.また,上記の研究方針の変更から,予定していた学会発表論文の投稿先にも一部変更が生じた. (使用計画) 繰越金の37,714円は,平成30年度の予算と合わせ,29年度に導入を見合わせた計算機周辺機器・ソフトウェアの導入,および論文投稿の予算として使用する予定である.
|