2021 Fiscal Year Research-status Report
順序性と解釈性を考慮した複合イベント処理ルールの半自動生成
Project/Area Number |
21K12146
|
Research Institution | Prefectural University of Hiroshima |
Principal Investigator |
岡部 正幸 県立広島大学, 地域創生学部, 准教授 (50362330)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ストリームデータ分類学習 / n-gramカーネル / マルチカーネル学習 |
Outline of Annual Research Achievements |
2021年度は,研究課題の1つである「イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築」について研究を進めた. まず,既存のshapeletに基づくストリームデータ分類学習アルゴリズムにshapelet間の順序関係情報を組み込むため,n-gramカーネルを導入した.shapeletを用いた既存アルゴリズムでは,分類対象となるストリームデータから一定長の部分系列をランダムに切り出し,選定基準を満たすものをshapelet集合とする.また,各ストリームデータは選定されたshapeletとの最小距離を並べた特徴ベクトルに変換され,分類モデルが生成される.本研究では,各shapeletの最小距離情報に加えshapelet間の順序関係を数量化したn-gramカーネルを導入するため,カーネルベースの分類学習を行うこととした.n-gramカーネルは,任意の2つの単語列における並びの類似性を数量化し行列として並べたものである.本研究では,shapeletを単語に見立てることで2つのストリームデータにおけるshapeletの並びの類似性を分類時の情報として組み込む.また,最小距離カーネルとn-gramカーネルの2つのカーネルの線形和を取る際の重みについては,カーネルアライメントに基づくマルチカーネル学習により求めることとした.更に,shapelet集合を決定する際に行うランダムに切り出した部分系列の有用性判定を行う順番について,これまでのランダムな決定方法から部分系列の出現頻度から計算される相互情報量に基づいた方法に変更した. 以上の改良点を加えたアルゴリズムを実装しベンチマークデータを用いた実験を行ったところ,その効果を確認することができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,大きく3つの課題に取り組むこととしているが,1つ目の課題「イベントの順序性を考慮したストリームデータ分類学習アルゴリズムの構築」については,今年度の研究実績の概要に示したように分類学習アルゴリズムの骨格は完成しており,性能をより向上させるための様々な改良を試している.2つ目の課題「モデル説明能力の高いイベントおよびイベント間順序関係抽出アルゴリズムの構築」については,シャープレイ値に基づいた既存の重要度算出方法の適用を試みている段階である.また,3つ目の課題「体調管理用CEPシステムの構築による実験的評価」については,ユーザの行動認識に利用するためのデータとして活動量計から加速度およびジャイロデータを取得し,WebSocketを通じてサーバにデータを集約する環境の構築を行っている段階である.
|
Strategy for Future Research Activity |
次年度は,引き続き分類学習アルゴリズムの改良に取り組んでいく.特に,shapelet抽出時に必要なパラメータ設定を減らすための方法,多変量時系列データに適用するための方法などについて重点的に研究を行っていく.また,重要度の高いshapeletを特定・可視化することにより判定根拠の妥当性・安全性を確認する方法や活動量計から取得したデータを処理するためのCEPシステムの構築について研究を進めていく.
|
Causes of Carryover |
次年度使用額が生じた理由は主に半導体不足による高速計算機の購入が滞ったこととコロナ禍による旅費の支出がなかったことによる.よって次年度はそれらについての執行を予定している.
|
Research Products
(3 results)