研究課題/領域番号 |
21K12146
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 県立広島大学 |
研究代表者 |
岡部 正幸 県立広島大学, 地域創生学部, 准教授 (50362330)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | ストリームデータ分類学習 / 合成shapelet / L1正則化 / SHAP値 / n-gramカーネル / マルチカーネル学習 / 複合イベント処理 / 説明可能AI |
研究開始時の研究の概要 |
複合イベント処理(CEP)は,複数のストリームデータ中で発生するイベントを検知し,対応するアクションの実行を通じてタイムリーなサービスを提供するための技術である.本研究の目的は,ストリームデータ分類学習と説明可能AIによるモデル解釈技術を用いて,有用性と安全性の高いCEPルールを半自動生成する方法を提案することである.具体的には,1. イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築,2. モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築,3. 体調管理用CEPシステムの構築による実験的評価,の3点について研究を行う.
|
研究実績の概要 |
今年度は,前年度に構築したshapeletに基づくストリームデータ分類学習アルゴリズムの改善を行なった.前年度に構築したアルゴリズムでは,初期shapelet集合を選定する際の基準として各shapelet候補のk-近傍法による分類能力を用いていたが,今年度はL1正則化付きロジスティック回帰を用いた方法に変更した.この選定方法では,shapelet候補を特徴としてL1正則化付きロジスティック回帰モデルを構築し,各特徴の重みが0でないものを初期shapelet集合とする.これにより,分類能力の高いshapelet候補を独立して選定するのではなく,分類能力の高いshapelet候補の組み合わせを選定することができる. 一方,前年度のアルゴリズムではもう一つ,合成shapelet生成時の組み合わせ爆発という問題があった.データ数またはデータ長の大きなデータセットでは,初期shapeletの数も増えるため合成shapeletの候補数も膨大になり,合成shapeletを構成する初期shapeletの組み合わせをアドホックな基準により選定する必要があった.今年度は初期shapeletの抽出元データと抽出位置を保存しておき,各データから選定された初期shapeletすべてを用いて1つの合成shapeletを生成することとした.これにより,生成される合成shapelet数は最大でもデータ数と同じになり,組み合わせ爆発を回避することができた.また,同一データ内での合成に限定することで,合成する2つのshapeletに重複区間がある場合には長さの異なるshapeletの生成ができ,重複区間がない場合には2つのshapeletの出現順序に関する情報を表現することが可能になった. ベンチマークデータを用いた実験では,今年度の改善点を組み込んだ提案アルゴリズムによる性能向上を確認することができた.ただし,L1正則化および合成shapeletの生成方法については改善の見込みがあり,その検証については次年度の課題とした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
今年度はL1正則化による初期shapelet選択の導入と合成shapelet生成方法の洗練化により,本研究の2つの課題「イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築」と「モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築」についてアルゴリズムの性能向上を実現することができた.3つ目の課題「体調管理用CEPシステムの構築による実験的評価」については,時系列データ分類問題の中でも特に行動認識タスクにおける構築アルゴリズムの有効性の検証を行なっている段階である.これらの事項について外部発表を今年度は一部行なったものの全体として遅れており,次年度に向けて早急に取り組んでいく必要がある.
|
今後の研究の推進方策 |
次年度は,今年度構築したアルゴリズムについて合成shapeletの生成方法の改善による性能向上について引き続き取り組んでいく.また構築したアルゴリズムの行動認識タスクにおける有用性について様々なデータを用いて検証する予定である.行動認識タスクについては多変量データも提供されているため,多変量データに対応した分類アルゴリズムについての検討も行なっていく.
|