2021 Fiscal Year Research-status Report
Towards a sublinear summarization for streaming partially-ordered data
Project/Area Number |
20K11935
|
Research Institution | Shizuoka University |
Principal Investigator |
山本 泰生 静岡大学, 情報学部, 准教授 (30550793)
|
Co-Investigator(Kenkyū-buntansha) |
酒向 重行 東京大学, 大学院理学系研究科(理学部), 准教授 (90533563)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | ストリームデータ / データ要約 / 測光時系列データ |
Outline of Annual Research Achievements |
本研究(3年間)の2年目にあたる本年は、カーネル密度推定(kernel density estimation, KDE)に基づく新しいサポートサマリアルゴリズムを提案した。KDEを対象とするスケッチとしてRACE (repeated arrays of count estimators) と呼ばれる確率的データ構造に着目し、これを多段に積層化することで順序関係を扱う任意の関係クエリに応答可能なサポートサマリを実現している。検討の過程で入力イベントと関係クエリの表現を組み合わせ的に拡張するアイデアを発見した。これにより本研究が当初より目標としていた半順序ストリームデータの劣線形要約を実現できる見通しが立った。組み合わせ拡張の技法をブラッシュアップすることでクエリ検索の時間計算量ならびにサマリ構築の空間計算量を理論的に明らかにすることができる見込みである.現在、理論と実証の両面から提案アルゴリズムのパフォーマンスを検証している。半順序ストリームデータの劣線形要約法は、時系列やグラフといった関係構造を有する多種多様なデータへ応用可能である。その中でインパクトのあるアプリケーションを探索することが求められている。また計画書の記載の通り、タイムドメイン天文学における測光時系列データを対象とする応用課題も進めており,データ要約法 dynamic bining を用いた突発検知アルゴリズムを提案している。この中で実際の測光時系列データに出現するフレアをリアルタイム検知する問題に対して提案法の性能評価を行っている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究が当初目標としていた半順序ストリームデータの劣線形要約の実現に向けたアルゴリズム開発が着実に進んでいる.具体的にはベクトル表現を多重化する組み合わせ拡張法を用いてサポートサマリを構築することが可能となる見込みが立っている.
|
Strategy for Future Research Activity |
提案手法の計算量に関する理論的性質を明らかにし,中・大規模データを含むベンチマークでの評価実験を速やかに行う.テラバイト級のWebアクセスログデータを対象としてギガバイトサイズまで軽量化できるかを実証的に確かめる.さらにトランザクション・時系列・グラフといった関係構造を有するストリームデータへの拡張を検討する.この中で可能であれば特許の出願と速やかな論文投稿を行う.
|
Causes of Carryover |
コロナ禍の状況が継続し、多くの学会発表がオンライン発表となったことで旅費に計上していた経費が未使用となっている.最終年度においても状況に変化のない場合はサーバー機器の整備ならびにリアルタイム検知システムの開発費に充当する予定である.
|
Research Products
(11 results)