順序性と解釈性を考慮した複合イベント処理ルールの半自動生成

Research Project

Project/Area Number	21K12146
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 62020:Web informatics and service informatics-related
Research Institution	Prefectural University of Hiroshima
Principal Investigator	岡部正幸県立広島大学, 地域創生学部, 准教授 (50362330)
Project Period (FY)	2021-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000) Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000) Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000) Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Keywords	ストリームデータ分類学習 / 合成shapelet / L1正則化 / SHAP値 / n-gramカーネル / マルチカーネル学習 / 複合イベント処理 / 説明可能AI
Outline of Research at the Start	複合イベント処理（CEP）は，複数のストリームデータ中で発生するイベントを検知し，対応するアクションの実行を通じてタイムリーなサービスを提供するための技術である．本研究の目的は，ストリームデータ分類学習と説明可能AIによるモデル解釈技術を用いて，有用性と安全性の高いCEPルールを半自動生成する方法を提案することである．具体的には，1. イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築，2. モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築，3. 体調管理用CEPシステムの構築による実験的評価，の3点について研究を行う．
Outline of Annual Research Achievements	今年度は，前年度に構築したshapeletに基づくストリームデータ分類学習アルゴリズムの改善を行なった．前年度に構築したアルゴリズムでは，初期shapelet集合を選定する際の基準として各shapelet候補のk-近傍法による分類能力を用いていたが，今年度はL1正則化付きロジスティック回帰を用いた方法に変更した．この選定方法では，shapelet候補を特徴としてL1正則化付きロジスティック回帰モデルを構築し，各特徴の重みが0でないものを初期shapelet集合とする．これにより，分類能力の高いshapelet候補を独立して選定するのではなく，分類能力の高いshapelet候補の組み合わせを選定することができる．一方，前年度のアルゴリズムではもう一つ，合成shapelet生成時の組み合わせ爆発という問題があった．データ数またはデータ長の大きなデータセットでは，初期shapeletの数も増えるため合成shapeletの候補数も膨大になり，合成shapeletを構成する初期shapeletの組み合わせをアドホックな基準により選定する必要があった．今年度は初期shapeletの抽出元データと抽出位置を保存しておき，各データから選定された初期shapeletすべてを用いて1つの合成shapeletを生成することとした．これにより，生成される合成shapelet数は最大でもデータ数と同じになり，組み合わせ爆発を回避することができた．また，同一データ内での合成に限定することで，合成する2つのshapeletに重複区間がある場合には長さの異なるshapeletの生成ができ，重複区間がない場合には2つのshapeletの出現順序に関する情報を表現することが可能になった．ベンチマークデータを用いた実験では，今年度の改善点を組み込んだ提案アルゴリズムによる性能向上を確認することができた．ただし，L1正則化および合成shapeletの生成方法については改善の見込みがあり，その検証については次年度の課題とした．
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 今年度はL1正則化による初期shapelet選択の導入と合成shapelet生成方法の洗練化により，本研究の2つの課題「イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築」と「モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築」についてアルゴリズムの性能向上を実現することができた．3つ目の課題「体調管理用CEPシステムの構築による実験的評価」については，時系列データ分類問題の中でも特に行動認識タスクにおける構築アルゴリズムの有効性の検証を行なっている段階である．これらの事項について外部発表を今年度は一部行なったものの全体として遅れており，次年度に向けて早急に取り組んでいく必要がある．
Strategy for Future Research Activity	次年度は，今年度構築したアルゴリズムについて合成shapeletの生成方法の改善による性能向上について引き続き取り組んでいく．また構築したアルゴリズムの行動認識タスクにおける有用性について様々なデータを用いて検証する予定である．行動認識タスクについては多変量データも提供されているため，多変量データに対応した分類アルゴリズムについての検討も行なっていく．

Report

(3 results)

Research Products
(4 results)

All 2024 2022 2021

All Presentation (4 results)

[Presentation] 合成シェイプレットを用いた時系列データ分類2024
- Author(s)
  岡部正幸
- Organizer
  第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024)
- Related Report
  2023 Research-status Report
[Presentation] 相互情報量に基づく特徴抽出と順序カーネルを利用した時系列データ分類2022
- Author(s)
  藤岡公平, 岡部正幸
- Organizer
  第14回データ工学と情報マネジメントに関するフォーラム（DEIM2022）
- Related Report
  2021 Research-status Report
[Presentation] Shapelet間の順序情報を利用した時系列データ分類2021
- Author(s)
  藤岡公平, 岡部正幸
- Organizer
  2021年電子情報通信学会総合大会
- Related Report
  2021 Research-status Report
[Presentation] Shapeletの出現順序を用いた時系列データ分類2021
- Author(s)
  藤岡公平, 岡部正幸
- Organizer
  2021年度人工知能学会全国大会
- Related Report
  2021 Research-status Report

順序性と解釈性を考慮した複合イベント処理ルールの半自動生成

Principal Investigator

岡部 正幸 県立広島大学, 地域創生学部, 准教授 (50362330)

¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)

Current Status of Research Progress

Reason

Report

Research Products

[Presentation] 合成シェイプレットを用いた時系列データ分類2024

Author(s)

Organizer

Related Report

[Presentation] 相互情報量に基づく特徴抽出と順序カーネルを利用した時系列データ分類2022

Author(s)

Organizer

Related Report

[Presentation] Shapelet間の順序情報を利用した時系列データ分類2021

Author(s)

Organizer

Related Report

[Presentation] Shapeletの出現順序を用いた時系列データ分類2021

Author(s)

Organizer

Related Report

岡部正幸県立広島大学, 地域創生学部, 准教授 (50362330)