研究課題/領域番号 |
19K01597
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分07030:経済統計関連
|
研究機関 | 統計数理研究所 |
研究代表者 |
川崎 能典 統計数理研究所, モデリング研究系, 教授 (70249910)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | テキストデータ / 高頻度データ / 動的トピックモデル / 時系列モデル / 多重スケール / ボラティリティ予測 / 実現ボラティリティ / Heterogeneous MDTM / Heterogeneous自己回帰 / 時系列予測 / ボラティリティ / 自然言語処理 / 潜在ディリクレモデル / トピックモデル |
研究開始時の研究の概要 |
本研究では、ニュース記事などのテキストデータからマーケットのセンチメントやブームを抽出し、金融資産の変動性の予測のためのモデリングと実証分析を行う。単語分布の重み付けでトピック(話題)が成り立っていると想定する一方、テキスト内の単語分布が時系列的な過去依存性を持つとする。資産変動性の予測は、日次、週次、月次と複数のタイムスケールを持つ時系列モデルにトピック指数を説明変数として投入し、変数選択を行う。また、これを各時点で繰り返すことで、各トピックの特徴付け・解釈を試みる。また、テキスト情報の一日の切れ目を変えることで、取引終了から取引開始までの情報累積効果の多寡を検証する。
|
研究成果の概要 |
テキストデータの系列(例えば日々の新聞記事)から、金融資産の変動(ボラティリティ)に関連しそうな「話題=トピック」の動向を時系列的に抜き出し、それをボラティリティ予測モデルに組み込んで予測を改善する統計的モデリング法について研究を行った。とりわけ、日次・週次・月次の多重時間スケールを明示的に取り込む提案を行った。その有効性を模擬予測で実証的に研究した結果、実験総ケース全体の35%程度で提案手法が優った。
|
研究成果の学術的意義や社会的意義 |
テキストデータ解析の方法自体は潜在ディリクレ分配法を筆頭にさまざまな研究がなされているが、多くは時点を固定した分析であり、テキスト系列からの動的な情報抽出に関する研究は多くない。本研究は経済統計学のテーマ設定で、金融資産の変動性予測の問題とテキスト解析を結びつけて考えたが、時間軸に沿ってテキストデータが流れてくる状況で、そこから抽出された情報を別の予測目的に結びつける問題は他にもあると思われ、今後異分野での展開が期待できる。
|