2022 Fiscal Year Research-status Report
順序性と解釈性を考慮した複合イベント処理ルールの半自動生成
Project/Area Number |
21K12146
|
Research Institution | Prefectural University of Hiroshima |
Principal Investigator |
岡部 正幸 県立広島大学, 地域創生学部, 准教授 (50362330)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ストリームデータ分類学習 / 合成shapelet / SHAP値 |
Outline of Annual Research Achievements |
2022年度は,shapeletに基づくストリームデータ分類学習アルゴリズムに2つの改良を加えた.1つ目は分類時に用いるshapeletを初期集合から段階的に合成・選別し,長さの異なるshapelet集合を使えるようにしたことである.2つ目はshapeletの選別を行う際にその評価をSHAP値と呼ばれる尺度を用いることでモデルの説明能力の高いものを選別できるようにしたことである. shapeletを用いた分類学習では,分類対象となるストリームデータから一定長の部分系列をランダムに切り出し,選定基準を満たすものをshapelet集合とする.また,各ストリームデータは選定されたshapeletとの最小距離を並べた特徴ベクトルに変換され,分類モデルが生成される.今年度の改良では,最初に抽出された初期shapelet集合を元に新たなshapeletの合成と選別を繰り返すことで長さの異なる有用なshapelet集合の生成を行えるようにした.shapeletの合成は,選別されたshapeletがどのデータのどの位置から抽出されたかを調べ,各データから抽出・合成されたshapeletをデータ上における出現位置のままつなぎ合わせることにより行われる.これによりshapelet間の出現順序だけでなく出現間隔も考慮することができ,性能の改善につながることが分かった.また,抽出・合成したshapelet候補の中から実際にshapeletとして使用するものを選別するための尺度として新たにSHAP値を用いることにより,分類性能と説明能力の高いものを選別できるようにした. 以上の改良点を加えたアルゴリズムを実装しベンチマークデータを用いた実験を行ったところ,従来手法と比較し性能が向上することを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究で取り組んでいる主な3つの課題のうち,1つ目の課題「イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築」と2つ目の課題「モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築」については,今年度の研究実績の概要に示したようにshapeletの合成とSHAP値の導入により実現することができた.また,3つ目の課題「体調管理用CEPシステムの構築による実験的評価」については,ユーザの行動認識に利用するためのデータとして活動量計から加速度およびジャイロデータを取得し,WebSocketを通じてサーバにデータを集約する環境の構築が完了し,ラジオ体操・ジェスチャー認識などのタスクに適用し評価を行っている.ただし,これらの事項について外部発表が遅れているため,次年度に向け早急に取り組んでいく必要がある.
|
Strategy for Future Research Activity |
次年度は,今年度考案した分類学習アルゴリズムにおけるパラメータ設定方法についての改善と多変量時系列データ分類への適用を進めていく.多変量時系列データ分類タスクとしては,センサーデータを用いた人の行動認識を扱うこととし,今年度構築したデータ収集環境を活用して実験を進めていく予定である.活動量計から得られる加速度およびジャイロデータは合計6次元となるため,各次元のデータから抽出したshapeletの相関性について検討する必要がある.
|
Causes of Carryover |
データ収集環境の構築を優先的に行っていたため,大量データを用いた実験評価用高速計算機の導入が遅れている.また,外部発表も遅れているため旅費等の支出がなかった.今年度は,高速計算機の導入と外部発表に使用する予定である.
|