研究課題/領域番号 |
17K06498
|
研究機関 | 山口大学 |
研究代表者 |
若佐 裕治 山口大学, 大学院創成科学研究科, 准教授 (60263620)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 制御系設計 / 深層学習 / データ駆動制御 |
研究実績の概要 |
本研究では、近年飛躍的に進展した深層学習の諸技術をデータ駆動型制御系設計法に適用し、不感帯やヒステリシスなどのさまざまな非線形性を有する制御対象に対して、統一的に良好な制御性能を与えるニューラルネットワークによる制御器、および補償器を構成する方法の開発を行う。また、通常制御系を設計する際には、設計者の試行錯誤による各種設定が必要であるが、この設定作業を深層学習、およびニューラルネットワークの諸技術を用いて低減させる方法を検討する。
本年度は、まず非線形補償器をニューラルネットワークによって構成し、補償器パラメータ(ニューラルネットワークのパラメータ)をデータ駆動制御の一種であるVRFT (Virtual Reference Feedback Tuning)によって調整する方法を開発した。そして非線形性をもつシステムとしてドローンを対象として実験検証を行い、PID制御のみではなく、非線形補償器の同時調整によって、制御性能が向上することを確認した。本成果を第60回自動制御連合講演会において発表した。さらに、ニューラルネットワークの中でも長期の記憶の取り扱いに優れていることが知られている LSTM (Long Short-Term Memory)を、むだ時間をもつ動的システムの補償器として用いる制御系の構成を提案し、これをVRFTによって調整する方法を検討した。その結果、本補償器は不感帯やヒステリシスなどの非線形性だけでなく、むだ時間に対しても、従来型の再帰型ニューラルネットワークに比べて十分な制御性能をもつことを確認した。この成果を第26回計測自動制御学会中国支部学術講演会、および第5回計測自動制御学会制御部門マルチシンポジウムにおいて発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究期間の初年度である本年度は、深層学習の諸技術によるデータ駆動型制御系設計法の開発に向けて、その基礎的な方法論について検討を行った。問題点の整理を行い、今後の発展につながる解決策の道筋が見えてきており、研究はおおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
本年度の研究結果に基づいて、データ駆動型制御系設計法に適したニューラルネットワーク構造や汎化性(ロバスト性)の向上方法を検討する。また、強化学習と深層学習を組み合わせた深層強化学習によるデータ駆動型制御系設計法の開発を推進し、より実用的な制御系設計法の実現を目指す。
|
次年度使用額が生じた理由 |
高性能GPUで構成される計算機システムの購入前の事前検討にやや時間を要したため、次年度使用額が生じた。検討結果に基づいて、計算機システムの購入とともに、シミュレーション用ソフトウェアや実験検証用システムの購入も適宜行う予定である。
|