2023 Fiscal Year Research-status Report
Research on Stream Processing Systems Enhanced by Deep Learning
Project/Area Number |
23K16888
|
Research Institution | University of Tsukuba |
Principal Investigator |
橋本 武彦 (BouSavong) 筑波大学, 計算科学研究センター, 助教 (80910760)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Keywords | 段階的な学習 / Transformer / 時系列予測 / 欠損値 / データクレンジング |
Outline of Annual Research Achievements |
今年の研究成果は、時系列予測とデータクレンジングにディープラーニングを使用することに焦点を当てている。1件の査読あり国際会議と 1 件の査読あり雑誌論文を出版した。
国際会議の論文では、データ クレンジング、特に欠落している属性値を扱う。既存の手法は、学習と予測に使用されるレコード間の違いを無視する。精度は十分ではないので、さらに改善できる可能性がある。本研究では、(1) 最大化ベースのアプローチ (MP) と (2) 距離比ベースのアプローチ (DP) の 2 つのソリューションを提案した。MP と DP は、値が欠落している不完全なレコードが、パラメーターの学習に使用されるレコードと可能な限り類似していることを保証する。k 個の最近傍セット (k-NN) だけでなく、k 個の完全なレコードの可能なすべての組み合わせである k-Set から、可能なすべてのパラメーターを学習する。不完全なレコードの修復された候補に最も類似するレコードから学習されたパラメータが選択される。実験的には、MP と DP は既存の手法よりも大幅に優れている。
雑誌論文では、時系列データの予測に焦点を当てている。時系列データの予測は、株価予測システム、天気予報など、さまざまな分野で役立つ。Informer は現在、最も効率的な予測モデルである。 Informer の主な欠点は、段階的な学習ができないことだ。Finformer と呼ばれる Fast Informer を提案する。Finformer は、セルフアテンションの位置/時間/値の埋め込みとクエリ/キー/値を段階的に効率的に計算できる。理論的には、Finformer は、最先端のモデル Informer よりもトレーニングと予測の両方の速度を向上させることができる。実験により、Finformer は Informer よりも約 26% 高速できる。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
-既存のアプローチのパフォーマンスを実際に改善できる優れた提案を考え出す -共著者との有意義な議論 -実装に費やす時間を短縮 -対象のデータセットを素早く見つけることができた -実験結果の生成に費やす時間が短縮された
|
Strategy for Future Research Activity |
-ディープラーニングを使用してリアルタイムのデータ問題を処理する可能性を研究する -深層学習を引き続き使用して、不完全で順序が乱れたデータ ストリームを処理する -ストリーム処理システムにディープラーニングを組み込んだプロトタイプシステムの作成を検討中。 -3本の論文を出版する予定
|
Causes of Carryover |
-2023年度内にもう1件の論文が採択されると想定しているが、決定は遅れているので、2023年度からの金額が少し残っている。
-この金額は2024年の予算と合わせて、旅費または論文掲載料に充てさせていただく予定
|