Project/Area Number |
20K19804
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60080:Database-related
|
Research Institution | Nagoya University |
Principal Investigator |
杉浦 健人 名古屋大学, 情報学研究科, 助教 (10821663)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 確率的イベントストリーム / データストリーム処理 / ストリーム処理 / パターンマイニング / 正規表現 |
Outline of Research at the Start |
本研究では①インクリメンタル処理に基づく代表的系列パターン検出手法の開発,②時間窓の組合せによる頻出・周期的系列パターンマイニング手法の開発,③システムとしての実装及び評価の3つの課題に取り組む.①では,最小記述長(Minimum Description Length: MDL)に基づく代表的系列パターン検出の確率的イベントストリーム・正規表現への拡張を行い,その成果に対して階層的にスライディング・タンブリングウィンドウを適用することで②の達成を目指す.また,①及び②の進捗に応じて適宜③を実施し,提案手法の性能や既存手法との比較を行う.
|
Outline of Annual Research Achievements |
本研究の目的である確率的イベントストリームからのリアルタイムな系列パターンマイニングについて、「1. インクリメンタル処理に基づく代表的系列パターン検出手法の開発」および「3. システムとしての実装及び評価」を中心に取り組んだ。特に、最小記述長に基づく代表系列パターンマイニング処理の実装に取り組み、1) アプリオリアルゴリズムに基づく候補系列パターンの生成、および2) 貪欲法に基づく代表系列パターン集合の発見の2段階の処理を実装した。実験により、曖昧な確率的イベントストリームから適切な系列パターンを発見できること、入力ストリームに対し妥当な実計算時間でパターンが発見できること、複雑なパターンであっても実計算時間が膨大にならないことを確認した。発見したパターンを効率的に管理、参照するためのインデックスについても継続して研究開発を実施しており、ロックフリーアルゴリズムを適切に扱えるデータ構造、および書込みが集中したノードを適応的に分割する処理の導入により、ストリーム処理のように書込み過多となるワークロードにおいて既存索引の8倍程度の性能を達成可能なロックフリー索引を開発した。また、イベントストリームのような多次元時空間データを効率的に扱うための空間索引として、トライ木の構造を利用しデータが密となった部分空間のみ空間分割を行うことで全体のメモリ使用量を改善し、全体の読み書き性能の改善および安定化を行う手法についても提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度時点で想定した実施項目については問題なく研究開発を完了した。一方で、昨年度以前に発生した遅れを取り戻すほどではなく、論文発表などいくつかの研究課題は残っている。
|
Strategy for Future Research Activity |
今年度に得られた研究成果について、国際会議・論文誌などでの発表準備を進める。また、サブテーマの1つである階層的ないし反復的なパターンの発見について手法の検討を行い、その可能性について示す。
|