• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Research on Stream Processing Systems Enhanced by Deep Learning

Research Project

Project/Area Number 23K16888
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 60080:Database-related
Research InstitutionUniversity of Tsukuba

Principal Investigator

橋本 武彦 (BouSavong)  筑波大学, 計算科学研究センター, 助教 (80910760)

Project Period (FY) 2023-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2026: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2025: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2023: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Keywords段階的な学習 / Transformer / 時系列予測 / 欠損値 / データクレンジング / ストリーム処理 / 非理想的なデータストリーム / 深層学習 / 値分布に一定の変化 / 理想的なデータストリーム
Outline of Research at the Start

既存のストリーム処理システム (SPS) は、エラーのないストリームを適切に処理できる。ストリームに多くのエラーがあった場合、精度は非常に悪化し、誤った判断と他の社会の問題につながる可能性がある。多くの分析では、非理想的なデータ ストリームを効率的に処理する必要がある。提案する計画では、SPDLと呼ばれる深層学習によって強化されたSPSの研究開発を行い、非理想的なデータ ストリームでのリアルタイム分析を行う。主な成果は次の3つである:(1) SPDLの原型を作成する、(2) 実際のアプリケーションに適用しデモを作成する、と(3) SPDLを評価し、5つの主要な研究出版物を発行することである。

Outline of Annual Research Achievements

今年の研究成果は、時系列予測とデータクレンジングにディープラーニングを使用することに焦点を当てている。1件の査読あり国際会議と 1 件の査読あり雑誌論文を出版した。

国際会議の論文では、データ クレンジング、特に欠落している属性値を扱う。既存の手法は、学習と予測に使用されるレコード間の違いを無視する。精度は十分ではないので、さらに改善できる可能性がある。本研究では、(1) 最大化ベースのアプローチ (MP) と (2) 距離比ベースのアプローチ (DP) の 2 つのソリューションを提案した。MP と DP は、値が欠落している不完全なレコードが、パラメーターの学習に使用されるレコードと可能な限り類似していることを保証する。k 個の最近傍セット (k-NN) だけでなく、k 個の完全なレコードの可能なすべての組み合わせである k-Set から、可能なすべてのパラメーターを学習する。不完全なレコードの修復された候補に最も類似するレコードから学習されたパラメータが選択される。実験的には、MP と DP は既存の手法よりも大幅に優れている。

雑誌論文では、時系列データの予測に焦点を当てている。時系列データの予測は、株価予測システム、天気予報など、さまざまな分野で役立つ。Informer は現在、最も効率的な予測モデルである。 Informer の主な欠点は、段階的な学習ができないことだ。Finformer と呼ばれる Fast Informer を提案する。Finformer は、セルフアテンションの位置/時間/値の埋め込みとクエリ/キー/値を段階的に効率的に計算できる。理論的には、Finformer は、最先端のモデル Informer よりもトレーニングと予測の両方の速度を向上させることができる。実験により、Finformer は Informer よりも約 26% 高速できる。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

-既存のアプローチのパフォーマンスを実際に改善できる優れた提案を考え出す
-共著者との有意義な議論
-実装に費やす時間を短縮
-対象のデータセットを素早く見つけることができた
-実験結果の生成に費やす時間が短縮された

Strategy for Future Research Activity

-ディープラーニングを使用してリアルタイムのデータ問題を処理する可能性を研究する
-深層学習を引き続き使用して、不完全で順序が乱れたデータ ストリームを処理する
-ストリーム処理システムにディープラーニングを組み込んだプロトタイプシステムの作成を検討中。
-3本の論文を出版する予定

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (2 results)

All 2024 2023

All Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Finformer: Fast Incremental and General Time Series Data Prediction2024

    • Author(s)
      BOU Savong、AMAGASA Toshiyuki、KITAGAWA Hiroyuki
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E107.D Issue: 5 Pages: 625-637

    • DOI

      10.1587/transinf.2023DAP0003

    • ISSN
      0916-8532, 1745-1361
    • Year and Date
      2024-05-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Efficient Missing Value Imputation by Maximum Distance Likelihood2023

    • Author(s)
      Savong Bou
    • Organizer
      2023 IEEE International Conference on Big Data (IEEE BigData 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi