2021 Fiscal Year Annual Research Report
データ活用制御手法の信頼性向上にむけた確率雑音の効用解析
Project/Area Number |
21J14577
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
伊藤 海斗 東京工業大学, 情報理工学院, 助教
|
Project Period (FY) |
2021-04-28 – 2023-03-31
|
Keywords | 最適制御 / プライバシー / 確率システム / エントロピー / 機械学習 |
Outline of Annual Research Achievements |
制御システム中の個人情報を含んだ信号のプライバシー保護をするために,確率雑音を活用する手法を研究した.具体的には,信号に雑音を印加することで,確率的な意味でプライバシー保護を達成する.プライバシー保護水準と制御性能はトレードオフの関係にあり,制御性能をできるだけ劣化させない雑音設計が重要である.特に信号の急激な変動情報を秘匿したい際には大きな雑音が必要になり,制御性能劣化が著しくなる課題があった.そこで,保護したいデータの事前情報(事前分布)をプライバシー評価に組み込んだ「ベイジアン差分プライバシー」の考え方を,制御システムに導入した.事前分布に従った時間変動をする信号に焦点を当てて雑音設計を行うことで,同じ大きさの雑音でも,より効率的にプライバシー保護ができる雑音共分散が与えられるようになった.さらに制御性能劣化が最小になる雑音設計を目的として,与えられたプライバシー水準を制約条件とした,雑音エネルギー最小化問題に取り組み,その最適解を導出した. また,データを活用した最適制御設計について研究を行った.特に,状態空間をランダム探索し,豊富な学習用データを取得する効果を最適制御器に付加するエントロピー正則化(最大エントロピー制御)の解析を行った.最大エントロピー制御はベルマン方程式を解く問題に帰着するが,次元の呪いの影響で数値的に解くことが一般に困難である.そこで本研究では,ベルマン方程式を直接解かずに,経路積分の手法を用いて最適制御がモンテカルロ計算できることを示した.この手法は,システムの軌道データがあれば計算可能であるため,システム自体が未知でも利用可能なモデルフリー設計手法を与える利点を有している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目標は(1)確率雑音が制御システムにおける学習にもたらす効用解析,(2)制御システムにおけるプライバシー保護手法の構築,の二つである.(1)に関して,強化学習で用いられるエントロピー正則化に着目した.これは最適制御器に確率性が意図的に付加される問題設定であり,本年度はその最適解を確率雑音で特徴づけることに成功した.(2)では特に,制御システム中の信号の急激な変動を秘匿することに焦点を当てており,その変動情報を明示的に考慮したプライバシー保護概念を制御システムに導入することができた.また,制御性能とプライバシー水準のトレードオフという重要な課題に対する答えも最適化問題の解として与えることができた.
|
Strategy for Future Research Activity |
確率雑音が制御システムにおける学習にもたらす効用解析に関して,引き続きエントロピー正則化に着目して研究を進める.本年度得られた正則化最適制御の特徴づけを活用して,システム制御の重要概念である可到達性・可観測性をシステムの雑音応答で特徴づけることに取り組む. 制御システムのプライバシー保護問題に関して,外れ値を含むデータの保護には外れ値が生じる雑音(安定分布雑音)が有効であることが,シミュレーションによって既に明らかになっている.一方,本年度では保護対象データの外れ値を明示的に考慮できる枠組みを導入した.今後は本枠組みの中で,安定分布雑音を外れ値データ保護に用いる利点を理論的に明らかにする.
|