2021 Fiscal Year Final Research Report
Financial time series forecast using information extracted from text data
Project/Area Number |
19K01597
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 07030:Economic statistics-related
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | テキストデータ / 高頻度データ / 動的トピックモデル / 時系列モデル / 多重スケール / ボラティリティ予測 / 実現ボラティリティ |
Outline of Final Research Achievements |
We studied a statistical modeling method to improve volatility forecasts by extracting trends in "topics" that may be related to changes in financial assets from a series of text data (e.g., daily newspaper articles) and by incorporating them into a volatility forecasting model. In particular, we proposed a method to explicitly incorporate daily, weekly, and monthly multiple time scales. The effectiveness of the proposed method was empirically studied through simulated forecasts, and the proposed method was superior in about 35% of the total experimental cases.
|
Free Research Field |
経済統計学、統計科学
|
Academic Significance and Societal Importance of the Research Achievements |
テキストデータ解析の方法自体は潜在ディリクレ分配法を筆頭にさまざまな研究がなされているが、多くは時点を固定した分析であり、テキスト系列からの動的な情報抽出に関する研究は多くない。本研究は経済統計学のテーマ設定で、金融資産の変動性予測の問題とテキスト解析を結びつけて考えたが、時間軸に沿ってテキストデータが流れてくる状況で、そこから抽出された情報を別の予測目的に結びつける問題は他にもあると思われ、今後異分野での展開が期待できる。
|