2018 Fiscal Year Annual Research Report
確率的イベントストリームにおけるパターンマイニングのための索引構築に関する研究
Project/Area Number |
18H06461
|
Allocation Type | Single-year Grants |
Research Institution | Nagoya University |
Principal Investigator |
杉浦 健人 名古屋大学, 情報学研究科, 研究員 (10821663)
|
Project Period (FY) |
2018-08-24 – 2020-03-31
|
Keywords | 確率的イベントストリーム / パターン抽出 / 正規表現 |
Outline of Annual Research Achievements |
本研究の目的である確率的イベントストリームにおけるパターンマイニングのための索引構築について,3つのサブ課題の一つである「確率的イベントストリームからのモデル(有限オートマトン)抽出」を中心に取り組んだ.特に,ある確率的イベントストリームを有限オートマトンとしてモデル化するための前準備として,ストリーム処理全般における一貫性に関する検討と,確率的イベントストリームからの正規表現パターンの抽出を中心に取り組んだ.近年では分散並列ストリーム処理システム技術に注目が集まっており,特にプロセッシングタイム(システムでイベントが処理された時刻)ではなくイベントタイム(イベントが実際に生起した時刻)に基づく処理に関する検討や提案が行われている.本研究で扱う確率的イベントストリームも性質としてはイベントタイムに基づくため,イベントタイムに基づくストリーム処理における一貫性についての調査及び検討を行った.また,これまで取り組んできた確率的イベントストリームからの正規表現パターンの抽出手法について,モデル(有限オートマトン)抽出への利用を行うために手法の再構成を行った.既存の手法は与えられた確率的イベントストリーム全体に対しバッチ処理でパターンを抽出する手法であったが,時間窓を用いて各時間帯における正規表現パターンをストリーム処理(インクリメンタル処理)で抽出できるよう拡張した.特に,時間窓を更に細かいチャンクに分割するスライシング技術を適用し,各チャンクの計算結果を再利用することで効率化を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当該年度において本研究との関連が強い論文が発表されたため,該当論文の調査及び手法の再現などを行っており,進捗状況に遅れが生じている.また,モデル(有限オートマトン)抽出において本研究課題申請時の想定とは異なる性質が見られたため,その確認も行っている.
|
Strategy for Future Research Activity |
当該年度に発表された最新の関連研究の調査・再現を行うとともに,情報理論に基づくモデル(有限オートマトン)抽出の検討を進める.具体的には,確率的イベントストリームの各時刻のイベント(離散確率分布)を入力とし,最小記述長(minimum description length)に基づき適切な抽象度の有限オートマトンの構築について検討する.
|