研究課題/領域番号 |
20K11935
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 静岡大学 |
研究代表者 |
山本 泰生 静岡大学, 情報学部, 准教授 (30550793)
|
研究分担者 |
酒向 重行 東京大学, 大学院理学系研究科(理学部), 准教授 (90533563)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | ストリームデータ / データ要約 / 測光時系列データ / ライトカーブデータ / 劣線形要約 / 半順序データ |
研究開始時の研究の概要 |
本研究ではこれまでの研究成果をもとに3つの課題に着手する.課題Ⅰでは射影積算法に基づき,時間・領域計算量O(log n) の劣線形EMS を開発する.課題ⅡではEMS,PMS,PSS の形式的関係に基づき,EMS からPMS,PMS からPSS へ順次拡張する.これにより EMS を基本モジュールとする劣線形 PSS を実現する.課題Ⅲでは天文学分野のエキスパートとの協力のもと,ストリーム型ビッグデータの実処理を通してPMS/PSS の応用可能性を検証していく.
|
研究実績の概要 |
本研究では順序関係を扱う任意の関係クエリに応答可能なサポートサマリを実現することを目的とし、これまでにカーネル密度推定に基づく新しいサポートサマリとして、Grid-RACE (Repeated Arrays of Count Estimators) を提案している。本年は Grid-RACE の空間計算量を検証するとともに、トランザクションデータの各種ベンチマークにおいて性能評価を行った。検証と評価実験の結果、Grid-RACEを用いて任意のクエリのサポートを推定できることがわかった。他方、構築にかかる空間計算量は最悪の場合、クエリサイズの指数オーダーとなることがわかった。この結果はGrid-RACEの理論的限界を示すものである。またタイムドメイン天文学における測光時系列データを対象とする応用課題において、突発信号をリアルタイム検知する提案法 (Elastic Data Binning. EDB) の性能評価をまとめた論文を出版している。さらに、離散構造を有するトランザクションストリームデータから頻出飽和系列パターンを高速に抽出するオンラインマイニング法を提案した。提案法では、任意の系列を距離付き集合に変換する起点順序分解法を用いており、アイテム集合マイニングの既存手法を用いて、高速に頻出系列パターンを抽出することが可能である。また抽出した系列パターンを素性とする系列予測問題に着手し、クリックストリームの実データを用いて系列パターンに基づく系列予測の性能評価を行った。実験の結果、従来のパターンより距離情報を加味した系列パターンの方が高い性能を持つことがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
半順序ストリームデータを対象とする新たな汎用サポートサマリを提案し、提案法の空間計算量を明らかにできた点から計画通り進捗していると言える。他方、当初目標としていたサポートサマリの劣線形性保証の観点から提案法とは異なるアプローチが求められる。
|
今後の研究の推進方策 |
頻度サマリ (Itemset-Frequency Summary) に関する近年の研究を再調査するとともに、従来取り組んできた決定性アルゴリズムによる劣線形化の可能性を実証実験をもとに検討し直す予定である。
|