ディープラーニングによって強化されたストリーム処理システムに関する研究

研究課題

研究課題/領域番号	23K16888
研究種目	若手研究
配分区分	基金
審査区分	小区分60080:データベース関連
研究機関	筑波大学
研究代表者	橋本武彦 (BouSavong) 筑波大学, 計算科学研究センター, 助教 (80910760)
研究期間 (年度)	2023-04-01 – 2027-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円) 2026年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2025年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
キーワード	段階的な学習 / Transformer / 時系列予測 / 欠損値 / データクレンジング / ストリーム処理 / 非理想的なデータストリーム / 深層学習 / 値分布に一定の変化 / 理想的なデータストリーム
研究開始時の研究の概要	既存のストリーム処理システム (SPS) は、エラーのないストリームを適切に処理できる。ストリームに多くのエラーがあった場合、精度は非常に悪化し、誤った判断と他の社会の問題につながる可能性がある。多くの分析では、非理想的なデータストリームを効率的に処理する必要がある。提案する計画では、SPDLと呼ばれる深層学習によって強化されたSPSの研究開発を行い、非理想的なデータストリームでのリアルタイム分析を行う。主な成果は次の3つである：(1) SPDLの原型を作成する、(2) 実際のアプリケーションに適用しデモを作成する、と(3) SPDLを評価し、5つの主要な研究出版物を発行することである。
研究実績の概要	今年の研究成果は、時系列予測とデータクレンジングにディープラーニングを使用することに焦点を当てている。1件の査読あり国際会議と 1 件の査読あり雑誌論文を出版した。国際会議の論文では、データクレンジング、特に欠落している属性値を扱う。既存の手法は、学習と予測に使用されるレコード間の違いを無視する。精度は十分ではないので、さらに改善できる可能性がある。本研究では、(1) 最大化ベースのアプローチ (MP) と (2) 距離比ベースのアプローチ (DP) の 2 つのソリューションを提案した。MP と DP は、値が欠落している不完全なレコードが、パラメーターの学習に使用されるレコードと可能な限り類似していることを保証する。k 個の最近傍セット (k-NN) だけでなく、k 個の完全なレコードの可能なすべての組み合わせである k-Set から、可能なすべてのパラメーターを学習する。不完全なレコードの修復された候補に最も類似するレコードから学習されたパラメータが選択される。実験的には、MP と DP は既存の手法よりも大幅に優れている。雑誌論文では、時系列データの予測に焦点を当てている。時系列データの予測は、株価予測システム、天気予報など、さまざまな分野で役立つ。Informer は現在、最も効率的な予測モデルである。 Informer の主な欠点は、段階的な学習ができないことだ。Finformer と呼ばれる Fast Informer を提案する。Finformer は、セルフアテンションの位置/時間/値の埋め込みとクエリ/キー/値を段階的に効率的に計算できる。理論的には、Finformer は、最先端のモデル Informer よりもトレーニングと予測の両方の速度を向上させることができる。実験により、Finformer は Informer よりも約 26% 高速できる。
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由 -既存のアプローチのパフォーマンスを実際に改善できる優れた提案を考え出す -共著者との有意義な議論 -実装に費やす時間を短縮 -対象のデータセットを素早く見つけることができた -実験結果の生成に費やす時間が短縮された
今後の研究の推進方策	-ディープラーニングを使用してリアルタイムのデータ問題を処理する可能性を研究する -深層学習を引き続き使用して、不完全で順序が乱れたデータストリームを処理する -ストリーム処理システムにディープラーニングを組み込んだプロトタイプシステムの作成を検討中。 -3本の論文を出版する予定

報告書

(1件)

2023 実施状況報告書

研究成果

(2件)

すべて 2024 2023

すべて雑誌論文 (1件) (うち国際共著 1件、査読あり 1件、オープンアクセス 1件) 学会発表 (1件) (うち国際学会 1件)

[雑誌論文] Finformer: Fast Incremental and General Time Series Data Prediction2024
- 著者名/発表者名
  BOU Savong、AMAGASA Toshiyuki、KITAGAWA Hiroyuki
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E107.D 号: 5 ページ: 625-637
- DOI
  10.1587/transinf.2023DAP0003
- ISSN
  0916-8532, 1745-1361
- 年月日
  2024-05-01
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[学会発表] Efficient Missing Value Imputation by Maximum Distance Likelihood2023
- 著者名/発表者名
  Savong Bou
- 学会等名
  2023 IEEE International Conference on Big Data (IEEE BigData 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会

ディープラーニングによって強化されたストリーム処理システムに関する研究

研究代表者

橋本 武彦 (BouSavong) 筑波大学, 計算科学研究センター, 助教 (80910760)

4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Finformer: Fast Incremental and General Time Series Data Prediction2024

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[学会発表] Efficient Missing Value Imputation by Maximum Distance Likelihood2023

著者名/発表者名

学会等名

関連する報告書

橋本武彦 (BouSavong) 筑波大学, 計算科学研究センター, 助教 (80910760)