研究課題/領域番号 |
20K19804
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 名古屋大学 |
研究代表者 |
杉浦 健人 名古屋大学, 情報学研究科, 助教 (10821663)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 確率的イベントストリーム / データストリーム処理 / ストリーム処理 / パターンマイニング / 正規表現 |
研究開始時の研究の概要 |
本研究では①インクリメンタル処理に基づく代表的系列パターン検出手法の開発,②時間窓の組合せによる頻出・周期的系列パターンマイニング手法の開発,③システムとしての実装及び評価の3つの課題に取り組む.①では,最小記述長(Minimum Description Length: MDL)に基づく代表的系列パターン検出の確率的イベントストリーム・正規表現への拡張を行い,その成果に対して階層的にスライディング・タンブリングウィンドウを適用することで②の達成を目指す.また,①及び②の進捗に応じて適宜③を実施し,提案手法の性能や既存手法との比較を行う.
|
研究実績の概要 |
本研究の目的である確率的イベントストリームからのリアルタイムな系列パターンマイニングについて、「1. インクリメンタル処理に基づく代表的系列パターン検出手法の開発」および「3. システムとしての実装及び評価」を中心に取り組んだ。特に、最小記述長に基づく代表系列パターンマイニング処理の実装に取り組み、1) アプリオリアルゴリズムに基づく候補系列パターンの生成、および2) 貪欲法に基づく代表系列パターン集合の発見の2段階の処理を実装した。実験により、曖昧な確率的イベントストリームから適切な系列パターンを発見できること、入力ストリームに対し妥当な実計算時間でパターンが発見できること、複雑なパターンであっても実計算時間が膨大にならないことを確認した。発見したパターンを効率的に管理、参照するためのインデックスについても継続して研究開発を実施しており、ロックフリーアルゴリズムを適切に扱えるデータ構造、および書込みが集中したノードを適応的に分割する処理の導入により、ストリーム処理のように書込み過多となるワークロードにおいて既存索引の8倍程度の性能を達成可能なロックフリー索引を開発した。また、イベントストリームのような多次元時空間データを効率的に扱うための空間索引として、トライ木の構造を利用しデータが密となった部分空間のみ空間分割を行うことで全体のメモリ使用量を改善し、全体の読み書き性能の改善および安定化を行う手法についても提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度時点で想定した実施項目については問題なく研究開発を完了した。一方で、昨年度以前に発生した遅れを取り戻すほどではなく、論文発表などいくつかの研究課題は残っている。
|
今後の研究の推進方策 |
今年度に得られた研究成果について、国際会議・論文誌などでの発表準備を進める。また、サブテーマの1つである階層的ないし反復的なパターンの発見について手法の検討を行い、その可能性について示す。
|