研究実績の概要 |
令和元年度に、多重スケール動的トピックモデル(MDTM)の枠組みにおける単語分布を、計量ファイナンスを意識して日次、週次、月次に対応するタイムスケールとする方法を実装し、令和2年度は、TOPIXの日次ボラティリティ予測の改善可能性を2種類の誤差関数に基づき比較・検討した。令和3年度は、定式化の幅を広げて、より広いモデル候補に関して提案手法の有効性を模擬予測の観点から研究した。その結果を以下に要約する。 ニュース記事のテキストデータに基づくトピックスコア時系列の抽出は、令和2年度に確立したHeterogeneous MDTM法と、比較対象としてオリジナルのMDTM(Iwata et al., 2010)で時間スケールを9まで(2の8乗まで)拡張したモデルを考慮した。 令和2年度は、Pattonの誤差関数の値を経験比較することにとどまっていたが、今年度は誤差関数の「差が有意かどうか」を検証するために、HansenのModel Confidence Set (MCS)の枠組みに基づく比較を行った。この方法では、誤差関数の差の分散をブートストラップで推定してある種の同等性検定を繰り返し、多段階でベストモデルを決める方法である。決勝で複数のモデルが生き残ることもあり、その意味でここでのベストはタイも許している。 全ての分析ケースでの「勝利数」を見ると、Heterogeneous MDTMが35%で最多だったが、オリジナルのMDTMで時間スケール6が27%、時間スケール9が20%で続いた。時間スケール6ということは単語分布のラグとして1,2,4,8,16,32を考えることに相当し、十分長いラグを確保すればHeterogenous MDTMに遜色ない精度で予測に貢献するトピック時系列を抽出する可能性があることを発見した。分析結果は、日本金融・証券計量・工学学会の夏季大会で発表した。
|