研究課題/領域番号 |
19K04448
|
研究機関 | 東京都立産業技術高等専門学校 |
研究代表者 |
福永 修一 東京都立産業技術高等専門学校, ものづくり工学科, 准教授 (70402518)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | システム同定 / 機械学習 / ロバスト統計 |
研究実績の概要 |
本研究では異常値が含まれる観測データからシステム同定を行うアルゴリズムを開発することが目的である.計画2年目にあたる2020年度は以下の4つの課題に取り組んだ. (1) システム同定のためにデータを取得することはコストがかかるため,実験の回数を抑えることが望ましい.前年度に提案したベータダイバージェンスを用いたロバストカーネル逐次最小二乗法において,データ数を抑えて推定を行うために応答曲面法を導入したことにより,従来手法よりも学習データが少ない状況で学習が行えることを示した. (2) データのプライバシを保護する方法として本研究では暗号化されたデータを用いてモデルを推定する方法を考える.前年度に提案したプライバシ保護機能を有するベータダイバージェンスを用いたロバスト線形回帰はデータが一括で得られた後にモデルのパラメータを推定している.今年度は各時刻において新しいデータが得られる状況においてモデルのパラメータを逐次的に推定するアルゴリズムに拡張した. (3) システム同定のための非線形モデルとしてこれまで様々なモデルが提案されてきたが,本研究ではポートハミルトン系に着目し,ポートハミルトン系のための強化学習アルゴリズムを提案した.強化学習はシステムの推定と制御を同時に行う手法である.本研究では自然勾配法を用いることにより従来よりも高速なポートハミルトン系のための学習アルゴリズムを提案した. (4) 実システムの同定を行い同定されたモデルを用いて制御を行う際には,同定に使用したデータ区間外でもシステムを動作させる場合がある.その際には同定モデルの外挿性能が問われる.これまでのシステム同定のための機械学習手法を外挿も行えるように,物理モデルと機械学習モデルの組み合わせによりモデリングを行う枠組であるグレーボックスモデリングの考え方を拡張し,外挿機能を有する関数近似器を提案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は研究実績の概要で述べた4つの課題に取り組み,それぞれの課題に対して有効な手法を提案した.具体的な成果は以下の4つである. (1) 前年度に提案したロバストカーネル逐次最小二乗法は,各時刻において新しいデータが得られる時にカーネル関数の重みを逐次的に更新するアルゴリズムである.新しく得られるデータを能動的にサンプリングできる場合には,学習が速くなるようにサンプリングすることを考える.ロバストカーネル逐次最小二乗法に応答曲面法を導入することにより,ランダムにデータが得られる場合よりも学習が高速であることを示した. (2) 前年度に提案したプライバシ保護機能を有するロバスト線形回帰を,逐次最小二乗法を用いることにより逐次アルゴリズムに拡張にした.導出したアルゴリズムは観測に外れ値が含まれた場合には重み関数の値を小さくすることによりパラメータを更新する値を抑えるものとなっている.外れ値が含まれた人工データを作成し,提案手法が外れ値の影響を受けずにパラメータの更新が行えることを示した. (3) 試行錯誤により制御則を獲得する強化学習を実システムに適用する際には学習回数を抑えることが好ましい.これまでに提案されたポートハミルトン系の強化学習はActor-Critic法を用いていたため,方策を学習するActor部分に自然勾配法を導入した.提案手法を倒立振子のシミュレーションに適用し,提案手法が従来手法よりも高速に学習が可能であることを示した. (4) 提案手法である外挿機能を有する関数近似器は,データが存在する区間では物理モデルと機械学習モデルを合わせた出力となり,データが存在しない区間では物理モデルによる出力のみとなる.データが存在しない区間で機械学習モデルが物理モデルに影響を及ぼさないように,本研究では関数近似器に正則化項を導入したRBFネットワークを採用した.
|
今後の研究の推進方策 |
次年度は今年度に得られた4つの成果をさらに発展させる方向で研究を実施する予定である. (1) 前年度に提案したロバストカーネル逐次最小二乗法はベータダイバージェンスを用いることにより外れ値を除去している.外れ値に対するロバスト推定において代表的なアルゴリズムにM推定がある.M推定は重み関数を適切に設計しなければ推定性能が劣化する.一方ベータダイバージェンスは重み関数が自然に決定される点が特徴である.次年度はベータダイバージェンスに基づく方法とM推定に基づく方法の比較を行い提案手法の有効性を検証する. (2) 前年度と今年度に提案したプライバシ保護機能を持つロバスト線形回帰は1次元の説明変数を用いた単回帰分析のアルゴリズムであった.次年度はこのアルゴリズムを重回帰分析へ拡張することを検討する.重回帰分析ではプライバシ保護の対象となる説明変数行列が垂直分割と水平分割の2種類に分割される.このような状況において外れ値が含まれるデータに対してロバスト推定を行うアルゴリズムを提案する. (3) 今年度提案したポートハミルトン系のための強化学習は観測に外れ値が含まれた場合を考慮していないアルゴリズムとなっている.実システムへの適用を考えた場合には観測に外れ値が含まれる場合がある.次年度はポートハミルトン系の強化学習を外れ値に対してロバストなアルゴリズムに拡張するために,ロバスト統計の導入を検討する. (4) 今年度提案した外挿機能を有する関数近似器は物理モデルと機械学習モデルが同じ割合で組み合わせて予測値を求めるアルゴリズムとなっている.物理モデルとデータの誤差が大きい時と小さい時でモデルの割合を変化させることができれば推定精度の向上が期待できる.次年度は観測データに応じてそれぞれのモデルの割合を適応的に変化させるアルゴリズムへの拡張を検討する.
|
次年度使用額が生じた理由 |
当初は学会発表のための出張旅費を予算に組み込んでいたが,新型コロナウイルス感染症が収束せずに学会がオンライン開催となったため,出張旅費を使用しなかった.次年度の成果発表の経費として使用する予定である.
|