Flexible Development Technology for Cyber Physical Systems Using Reinforcement Learning
Project/Area Number |
16K06424
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Control engineering/System engineering
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
Matsumoto Keinosuke 大阪府立大学, 工学(系)研究科(研究院), 客員研究員 (90285304)
|
Co-Investigator(Renkei-kenkyūsha) |
MORI Naoki 大阪府立大学, 大学院工学研究科, 准教授 (90295717)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Project Status |
Completed (Fiscal Year 2018)
|
Budget Amount *help |
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2018: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
Fiscal Year 2017: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2016: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
|
Keywords | サイバーフィジカルシステム / 機械学習 / エージェント / モデル駆動開発 / システム情報(知識)処理 |
Outline of Final Research Achievements |
Cyber physical systems are modeled as multi-agent systems that act autonomously. To speed up learning, we have developed a new reinforcement learning method that shares other agents' action histories. Furthermore, by placing models that are the design drawing of software at the center of development, model-driven development method enables model reuse, conversion to different types of models, and automatic generation of source code from the models. We have got the prospect that the proposed method can withstand practical use as a flexible development method if the method is applied to the real world.
|
Academic Significance and Societal Importance of the Research Achievements |
研究代表者が開発したシステム効用の最大化を図る交渉プロトコルを適用することにより,システム評価を最大化でき,さらに実フィールド環境では不確実性や計測不能な未知パラメータが存在するため,試行錯誤を通して環境に適応する強化学習を採用した.これらによりネットワーク通信技術と組み合わせシステムを正当な状況下で運用させることができ,信頼性・安全性が大幅に向上する.またマルチエージェントによるシミュレーションを利用するため,想定外の状況が創発される可能性をもつ点で他の手法より優位性を持つ.
|
Report
(4 results)
Research Products
(26 results)