2019 Fiscal Year Research-status Report
オンライン近似圧縮に基づく次世代ストリームデータマイニング法の開発
Project/Area Number |
17K00301
|
Research Institution | Shizuoka University |
Principal Investigator |
山本 泰生 静岡大学, 情報学部, 准教授 (30550793)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | ストリームデータ / 頻出パターンマイニング / オンラインアルゴリズム |
Outline of Annual Research Achievements |
科研の3年目にあたる今年度は,オンライン頻出パターンマイニング法に関する研究成果 (研究課題[A]) を論文に取りまとめた (Journal of Intelligent Information Systems に採録).また昨年度の懸案事項であった Membership query filtering の劣線形化法についても検討を進めた.はじめに Compressed Hashingに基づく filtering 手法の提案した (JSAI-KBS研究会にて発表).Compressed Hashing は高次元データの最近傍探索法であり,データ全体からランダムに選択して構成されるアンカー (代表点) を用いて近傍点の有無を探索することができる.本研究では,この Compressed Hashing と一様独立なハッシュ関数によるデータ射影を組み合わせることで Membership query filter を構築できることを示した.提案法の領域計算量と誤り率の関係を調査したところ,当初目標としていた対数スケールの省メモリ化は理論的に難しいことがわかった.次に,省メモリ化をさらに進めるため,射影積算法と呼ぶ filtering 手法を提案した (情報処理学会プログラミング研究会にて発表).各データの射影ベクトルの積算ベクトルから membership query に応答できる性質を利用したこれまでにない filtering 手法である.対数スケールの省メモリ化の期待もあり,今後さらに理論的な考察を進める予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
昨年度の懸案であった membership query filtering に関する検討課題については当初の計画の通り遂行できた.研究課題[A]に関してこれまでの成果を論文として取りまとめることができた.他方,研究課題[B]に関しては成果取りまとめまで完遂することができなかった.
|
Strategy for Future Research Activity |
頻出系列パターンマイニング (研究課題[B]) に関する成果を論文として取りまとめる.またMembership query filtering に関しては,提案する射影積算法の理論的考察を進める予定である.
|
Causes of Carryover |
頻出系列パターンマイニング (研究課題[B]) の研究成果報告が当初予定より遅れており今年度中に完遂できなかった.当該助成金は次年度にこの成果報告を行うために利用する予定である.
|