研究課題/領域番号 |
21K14178
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分21040:制御およびシステム工学関連
|
研究機関 | 群馬大学 |
研究代表者 |
川口 貴弘 群馬大学, 大学院理工学府, 助教 (00869844)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | 分散制御 / 強化学習 / レトロフィット制御 / 制御工学 / 安定性 |
研究開始時の研究の概要 |
分散制御系の分散設計法として提案されたレトロフィット制御理論を強化学習に適用し,安定性を保証した強化学習手法を開発する.レトロフィット制御理論は既知のサブシステムと未知のサブシステムが接続されたシステムに対する制御系設計法である.レトロフィット制御理論では,制御器は未知サブシステムから得られる信号を調整する整流器と,既知サブシステムを安定化する内部制御器から構成される.強化学習にレトロフィット制御理論を適用するために,整流器の構造付きの強化学習法と,学習による制御器が既知サブシステムを安定化することを保証する方法を検討することで,安定性を保証した強化学習法を達成する.
|
研究成果の概要 |
システムの一部のモデルのみが既知である場合の制御手法であるレトロフィット制御に強化学習を組み合わせた新たな制御手法を提案した.具体的には,レトロフィット制御に特有の構造である整流器を保持しながら制御則の学習を行う手法を提案した.これにより,システムの安定性を理論的に保証しつつ,強化学習によって環境の変化に適応する制御が可能になった.提案法の有用性を電力システムを簡単化したモデルに対する数値シミュレーションと,簡単な実機実験によって確かめた.
|
研究成果の学術的意義や社会的意義 |
一般に,強化学習は環境の変化に適応する制御手法として知られているが,制御系の最も基本的で重要な性質の安定性を理論的に保証することが困難であった.本研究では制御を行う前のシステムが安定であるという事前情報を活用し,レトロフィット制御理論を応用することにより,強化学習による制御系の安定性を理論的に保証することができた.これにより,産業界などでの実用化の際に,学習途中での機器の暴走などを防止することが可能となる.
|