テキストデータからの情報抽出を利用した金融時系列予測

研究課題

研究課題/領域番号	19K01597
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分07030:経済統計関連
研究機関	統計数理研究所
研究代表者	川崎能典統計数理研究所, モデリング研究系, 教授 (70249910)
研究期間 (年度)	2019-04-01 – 2022-03-31
研究課題ステータス	完了 (2021年度)
配分額 *注記	4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円) 2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	テキストデータ / 高頻度データ / 動的トピックモデル / 時系列モデル / 多重スケール / ボラティリティ予測 / 実現ボラティリティ / Heterogeneous MDTM / Heterogeneous自己回帰 / 時系列予測 / ボラティリティ / 自然言語処理 / 潜在ディリクレモデル / トピックモデル
研究開始時の研究の概要	本研究では、ニュース記事などのテキストデータからマーケットのセンチメントやブームを抽出し、金融資産の変動性の予測のためのモデリングと実証分析を行う。単語分布の重み付けでトピック（話題）が成り立っていると想定する一方、テキスト内の単語分布が時系列的な過去依存性を持つとする。資産変動性の予測は、日次、週次、月次と複数のタイムスケールを持つ時系列モデルにトピック指数を説明変数として投入し、変数選択を行う。また、これを各時点で繰り返すことで、各トピックの特徴付け・解釈を試みる。また、テキスト情報の一日の切れ目を変えることで、取引終了から取引開始までの情報累積効果の多寡を検証する。
研究成果の概要	テキストデータの系列（例えば日々の新聞記事）から、金融資産の変動（ボラティリティ）に関連しそうな「話題＝トピック」の動向を時系列的に抜き出し、それをボラティリティ予測モデルに組み込んで予測を改善する統計的モデリング法について研究を行った。とりわけ、日次・週次・月次の多重時間スケールを明示的に取り込む提案を行った。その有効性を模擬予測で実証的に研究した結果、実験総ケース全体の35%程度で提案手法が優った。
研究成果の学術的意義や社会的意義	テキストデータ解析の方法自体は潜在ディリクレ分配法を筆頭にさまざまな研究がなされているが、多くは時点を固定した分析であり、テキスト系列からの動的な情報抽出に関する研究は多くない。本研究は経済統計学のテーマ設定で、金融資産の変動性予測の問題とテキスト解析を結びつけて考えたが、時間軸に沿ってテキストデータが流れてくる状況で、そこから抽出された情報を別の予測目的に結びつける問題は他にもあると思われ、今後異分野での展開が期待できる。

報告書

(4件)

研究成果
(10件)

すべて 2021 2020 2019

すべて雑誌論文 (1件) 学会発表 (9件) (うち国際学会 4件)

[雑誌論文] Volatility Forecasting with the Heterogeneous AR-type Multiscale Dynamic Topic Model2021
- 著者名/発表者名
  Kawasaki, Y. and Morimoto, T.
- 雑誌名
  
  2021年度JAFEE夏季大会予稿集
  
  巻: 1 ページ: 12-21
- 関連する報告書
  2021 実績報告書
[学会発表] Volatility Forecasting with the Heterogeneous AR-type Multiscale Dynamic Topic Model2021
- 著者名/発表者名
  Kawasaki, Y. and Morimoto, T.
- 学会等名
  日本金融・証券計量・工学学会
- 関連する報告書
  2021 実績報告書
[学会発表] On a HAR-type Specification in Dynamic Topic Model and its Application in Volatility Forecasting2020
- 著者名/発表者名
  Kawasaki, Y. and Morimoto, T.
- 学会等名
  11th CEQURA Conference 2020 on Advances in Financial and Insurance Risk Management
- 関連する報告書
  2020 実施状況報告書
- 国際学会
[学会発表] Examining the Effects of Expanded Trading Hours Using High Frequency Data in Finance2020
- 著者名/発表者名
  Kawasaki, Y.
- 学会等名
  Joint Statistical Meeting (JSM) 2020
- 関連する報告書
  2020 実施状況報告書
- 国際学会
[学会発表] A bias-reduced GARCH-EVT approach for financial risk estimation2020
- 著者名/発表者名
  貝淵響，川崎能典，Gilles Stupfler
- 学会等名
  2020年度統計関連学会連合大会
- 関連する報告書
  2020 実施状況報告書
[学会発表] RS-Decomp2020
- 著者名/発表者名
  川崎能典
- 学会等名
  2020年度R研究集会(統計数理研究所共同利用研究集会「データ解析環境Rの整備と利用」)
- 関連する報告書
  2020 実施状況報告書
[学会発表] Forecasting Financial Market Volatility Using a Dynamic Topic Model2019
- 著者名/発表者名
  Kawasaki, Y. and Morimoto, T.
- 学会等名
  62nd ISI World Statistics Congress, Kuala Lumpur, Malaysia
- 関連する報告書
  2019 実施状況報告書
- 国際学会
[学会発表] A novel GARCH-EVT approach dealing with bias and heteroscedasticity2019
- 著者名/発表者名
  Kaibuchi, H. and Kawasaki, Y.
- 学会等名
  CEQURA Conference 2019 on Advances in Financial and Insurance Risk Management, Munich, Germany
- 関連する報告書
  2019 実施状況報告書
- 国際学会
[学会発表] A novel GARCH-EVT approach to VaR estimation dealing with bias and heteroscedasticity2019
- 著者名/発表者名
  貝淵響，川崎能典
- 学会等名
  2019年度中之島ワークショップ「金融工学・数理計量ファイナンスの諸問題2019」
- 関連する報告書
  2019 実施状況報告書
[学会発表] テキスト系列からの動的トピックの抽出によるボラティリティ予測2019
- 著者名/発表者名
  川崎能典
- 学会等名
  リスク解析戦略研究センター第7回金融シンポジウム「金融が直面する新環境への対応と方法論II」
- 関連する報告書
  2019 実施状況報告書

テキストデータからの情報抽出を利用した金融時系列予測

研究代表者

川崎 能典 統計数理研究所, モデリング研究系, 教授 (70249910)

4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)

報告書

研究成果

[雑誌論文] Volatility Forecasting with the Heterogeneous AR-type Multiscale Dynamic Topic Model2021

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Volatility Forecasting with the Heterogeneous AR-type Multiscale Dynamic Topic Model2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] On a HAR-type Specification in Dynamic Topic Model and its Application in Volatility Forecasting2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Examining the Effects of Expanded Trading Hours Using High Frequency Data in Finance2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] A bias-reduced GARCH-EVT approach for financial risk estimation2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] RS-Decomp2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Forecasting Financial Market Volatility Using a Dynamic Topic Model2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] A novel GARCH-EVT approach dealing with bias and heteroscedasticity2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] A novel GARCH-EVT approach to VaR estimation dealing with bias and heteroscedasticity2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] テキスト系列からの動的トピックの抽出によるボラティリティ予測2019

著者名/発表者名

学会等名

関連する報告書

川崎能典統計数理研究所, モデリング研究系, 教授 (70249910)