• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

Towards a sublinear summarization for streaming partially-ordered data

Research Project

Project/Area Number 20K11935
Research InstitutionShizuoka University

Principal Investigator

山本 泰生  静岡大学, 情報学部, 准教授 (30550793)

Co-Investigator(Kenkyū-buntansha) 酒向 重行  東京大学, 大学院理学系研究科(理学部), 准教授 (90533563)
Project Period (FY) 2020-04-01 – 2025-03-31
Keywordsストリームデータ / データ要約 / 測光時系列データ
Outline of Annual Research Achievements

本研究では順序関係を扱う任意の関係クエリに応答可能なサポートサマリを実現することを目的とし、これまでにカーネル密度推定に基づく新しいサポートサマリとして、Grid-RACE (Repeated Arrays of Count Estimators) を提案している。本年は Grid-RACE の空間計算量を検証するとともに、トランザクションデータの各種ベンチマークにおいて性能評価を行った。検証と評価実験の結果、Grid-RACEを用いて任意のクエリのサポートを推定できることがわかった。他方、構築にかかる空間計算量は最悪の場合、クエリサイズの指数オーダーとなることがわかった。この結果はGrid-RACEの理論的限界を示すものである。またタイムドメイン天文学における測光時系列データを対象とする応用課題において、突発信号をリアルタイム検知する提案法 (Elastic Data Binning. EDB) の性能評価をまとめた論文を出版している。さらに、離散構造を有するトランザクションストリームデータから頻出飽和系列パターンを高速に抽出するオンラインマイニング法を提案した。提案法では、任意の系列を距離付き集合に変換する起点順序分解法を用いており、アイテム集合マイニングの既存手法を用いて、高速に頻出系列パターンを抽出することが可能である。また抽出した系列パターンを素性とする系列予測問題に着手し、クリックストリームの実データを用いて系列パターンに基づく系列予測の性能評価を行った。実験の結果、従来のパターンより距離情報を加味した系列パターンの方が高い性能を持つことがわかった。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

半順序ストリームデータを対象とする新たな汎用サポートサマリを提案し、提案法の空間計算量を明らかにできた点から計画通り進捗していると言える。他方、当初目標としていたサポートサマリの劣線形性保証の観点から提案法とは異なるアプローチが求められる。

Strategy for Future Research Activity

頻度サマリ (Itemset-Frequency Summary) に関する近年の研究を再調査するとともに、従来取り組んできた決定性アルゴリズムによる劣線形化の可能性を実証実験をもとに検討し直す予定である。

Causes of Carryover

サポートサマリの理論的性質の検証と性能評価実験に時間を要しており、当初予定していた学会参加費ならびに物品購入を次年度に持ち越すこととした。

  • Research Products

    (8 results)

All 2024 2023 Other

All Journal Article (4 results) (of which Peer Reviewed: 2 results) Presentation (3 results) (of which Invited: 1 results) Remarks (1 results)

  • [Journal Article] Online Closed Episode Mining with Root-Order Decomposition2023

    • Author(s)
      Sako Hinano、Yamamoto Yoshitaka
    • Journal Title

      2023 IEEE Int. Conf. on BigData

      Volume: - Pages: 2683-2689

    • DOI

      10.1109/BigData59044.2023.10386577

    • Peer Reviewed
  • [Journal Article] Elastic Data Binning: Time-Series Sketching for Time-Domain Astrophysics Analysis2023

    • Author(s)
      Phungtua-eng Thanapol、Sako Shigeyuki、Nishikawa Yushi、Yamamoto Yoshitaka
    • Journal Title

      ACM SIGAPP Applied Computing Review

      Volume: 23 Pages: 5~22

    • DOI

      10.1145/3610409.3610410

    • Peer Reviewed
  • [Journal Article] 起点順序分解に基づく頻出飽和系列マイニングの可用性調査2023

    • Author(s)
      酒匂 日菜乃、山本 泰生
    • Journal Title

      人工知能学会研究会資料 知識ベースシステム研究会

      Volume: 129 Pages: 01~16

    • DOI

      10.11517/jsaikbs.129.0_01

  • [Journal Article] 系列予測タスクにおける飽和距離付き系列の可用性調査2023

    • Author(s)
      酒匂 日菜乃、山本 泰生
    • Journal Title

      人工知能学会研究会資料 知識ベースシステム研究会

      Volume: 130 Pages: 42~47

    • DOI

      10.11517/jsaikbs.130.0_42

  • [Presentation] 大規模データストリームの劣線形要約とリアルタイム異常検知への応用2024

    • Author(s)
      山本泰生
    • Organizer
      JST新技術説明会
  • [Presentation] 重み付き起点順序分解に基づく飽和系列マイニング2023

    • Author(s)
      酒匂日菜乃, 山本泰生
    • Organizer
      第22回情報科学技術フォーラム
  • [Presentation] 時系列データを扱うデータマイニングと機械学習の応用可能性を考える2023

    • Author(s)
      山本泰生
    • Organizer
      第147回「産学官交流会」講演会
    • Invited
  • [Remarks] 研究室HP

    • URL

      https://lab.inf.shizuoka.ac.jp/yamamoto/member.html

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi