• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

順序性と解釈性を考慮した複合イベント処理ルールの半自動生成

研究課題

研究課題/領域番号 21K12146
研究機関県立広島大学

研究代表者

岡部 正幸  県立広島大学, 地域創生学部, 准教授 (50362330)

研究期間 (年度) 2021-04-01 – 2024-03-31
キーワードストリームデータ分類学習 / 合成shapelet / SHAP値
研究実績の概要

2022年度は,shapeletに基づくストリームデータ分類学習アルゴリズムに2つの改良を加えた.1つ目は分類時に用いるshapeletを初期集合から段階的に合成・選別し,長さの異なるshapelet集合を使えるようにしたことである.2つ目はshapeletの選別を行う際にその評価をSHAP値と呼ばれる尺度を用いることでモデルの説明能力の高いものを選別できるようにしたことである.
shapeletを用いた分類学習では,分類対象となるストリームデータから一定長の部分系列をランダムに切り出し,選定基準を満たすものをshapelet集合とする.また,各ストリームデータは選定されたshapeletとの最小距離を並べた特徴ベクトルに変換され,分類モデルが生成される.今年度の改良では,最初に抽出された初期shapelet集合を元に新たなshapeletの合成と選別を繰り返すことで長さの異なる有用なshapelet集合の生成を行えるようにした.shapeletの合成は,選別されたshapeletがどのデータのどの位置から抽出されたかを調べ,各データから抽出・合成されたshapeletをデータ上における出現位置のままつなぎ合わせることにより行われる.これによりshapelet間の出現順序だけでなく出現間隔も考慮することができ,性能の改善につながることが分かった.また,抽出・合成したshapelet候補の中から実際にshapeletとして使用するものを選別するための尺度として新たにSHAP値を用いることにより,分類性能と説明能力の高いものを選別できるようにした.
以上の改良点を加えたアルゴリズムを実装しベンチマークデータを用いた実験を行ったところ,従来手法と比較し性能が向上することを確認した.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本研究で取り組んでいる主な3つの課題のうち,1つ目の課題「イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築」と2つ目の課題「モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築」については,今年度の研究実績の概要に示したようにshapeletの合成とSHAP値の導入により実現することができた.また,3つ目の課題「体調管理用CEPシステムの構築による実験的評価」については,ユーザの行動認識に利用するためのデータとして活動量計から加速度およびジャイロデータを取得し,WebSocketを通じてサーバにデータを集約する環境の構築が完了し,ラジオ体操・ジェスチャー認識などのタスクに適用し評価を行っている.ただし,これらの事項について外部発表が遅れているため,次年度に向け早急に取り組んでいく必要がある.

今後の研究の推進方策

次年度は,今年度考案した分類学習アルゴリズムにおけるパラメータ設定方法についての改善と多変量時系列データ分類への適用を進めていく.多変量時系列データ分類タスクとしては,センサーデータを用いた人の行動認識を扱うこととし,今年度構築したデータ収集環境を活用して実験を進めていく予定である.活動量計から得られる加速度およびジャイロデータは合計6次元となるため,各次元のデータから抽出したshapeletの相関性について検討する必要がある.

次年度使用額が生じた理由

データ収集環境の構築を優先的に行っていたため,大量データを用いた実験評価用高速計算機の導入が遅れている.また,外部発表も遅れているため旅費等の支出がなかった.今年度は,高速計算機の導入と外部発表に使用する予定である.

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi