2018 Fiscal Year Annual Research Report
A modeling and evaluation method for large-scale systems using scene transition nets
Project/Area Number |
16K06198
|
Research Institution | Aichi University of Technology |
Principal Investigator |
舘山 武史 愛知工科大学, 工学部, 教授(移行) (70336527)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 離散・連続混合システム / モデリング / シミュレーション / マルチエージェント / 強化学習 / 最適化 |
Outline of Annual Research Achievements |
本研究では、System of Systems(SoS)の概念の対象となるような複雑・大規模システムのサブシステムを多種多様な既存手法を用いて個々にモデル化し、離散・連続混合システムのモデリング・シミュレーションを可能とする「場面遷移ネット」によってこれらを統合することにより、相互作用関係の表現を実現する。また、SoSの動作確認および最適化を容易に可能とすることを目的とした、汎用的なシミュレーション・最適化ツールを開発することを目標としている。 最終年度は、本研究の成果の一つである場面遷移ネットGUIシミュレータに組み込む、大規模システムの最適化アルゴリズムの開発を主として行った。ここでは、本研究で対象とする複雑・大規模システムをマルチエージェントシステムとしてとらえ、強化学習によって高効率かつ高確率での最適解の獲得を実現する学習アルゴリズムを提案した。具体的には、経験共有を導入したマルチエージェント強化学習システムにおいて,「探索に集中するエージェント」と「報酬獲得に集中するエージェント」の2種類のエージェントを設定し、そして個々のエージェントにそれぞれ異なる役割を分担させることにより、より効率的な探索および強化学習の高速化を実現した。さらに、その役割分担の設定指針や、システム全体の状況に応じてマルチエージェント強化学習の役割分担を変化させるプロセスを,「組織学習」の枠組みに従って実現する手法を提案し、より効率的な学習を可能とした。 そして、場面遷移ネットの演算の高速化の実現、および前述の提案手法を応用した深層強化学習アルゴリズムを用いた最適化手法を導入するために、GPGPUを用いたシミュレーション・学習システムの基盤を構築し、動作確認を行った。 今後は、開発した場面遷移ネットシミュレータと最適化システムを統合し、汎用的なシミュレーション・最適化ツールとして完成させる。
|