2023 Fiscal Year Annual Research Report
Project/Area Number |
21K14178
|
Research Institution | Gunma University |
Principal Investigator |
川口 貴弘 群馬大学, 大学院理工学府, 助教 (00869844)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 分散制御 / 強化学習 / レトロフィット制御 |
Outline of Annual Research Achievements |
レトロフィット制御理論と強化学習法を組み合わせることで,どのようなデータが得られたとしても制御系の安定性を保証できる適応的な分散制御法の構築を目指して研究を行った.レトロフィット制御理論によって安定性を保証する鍵の一つは,対象の物理によって決まる整流器を制御器の内部に含めることである.このような整流器を含んだうえで,内部制御器のみを学習する,構造付きの強化学習法を提案した.まず,レトロフィット制御に特有の構造付きの強化学習法を実現するためには,内部制御器を有限インパルス応答によって表現することが必要であることを明らかにした.そして,有限インパルス応答表現を用いた強化学習法の適用について,精度向上のための手法の検討を行った.インパルス応答表現を用いる際には,制御に用いる信号の過去の値を多数保持し,それらの係数を学習によって求めることが必要である.求めるパラメータ数が多くなり,雑音などの影響で精度低下する欠点を解決するために,近年システム同定の分野で注目されているカーネルに基づく正則化法を組み合わせて利用することを提案した.さらに,強化学習を行う主体が単一ではなく,一つの大規模システムを複数の主体が管理する状況の想定において複数主体が同時に強化学習を行う状況への適用についても検討した.シミュレーションを通して,それぞれの主体の学習結果が互いに悪影響を及ぼすことはなく,単一主体での学習では達成不可能な性能を達成できることを示した.これまで,強化学習に限らないレトロフィット制御理論の有用性の検証は数値シミュレーションにとどまることが多かったが,最終年度には実機実験による検証を行った.システムの構成を容易に変更できる実験機器の構成を考案し,それを切り替えながら制御することにより,システムの変化に対しても安定性を損なうことなく制御を行うことができることを示した.
|