2020 Fiscal Year Research-status Report
Statistical analysis of high-dimensional high-frequency data
Project/Area Number |
19K13668
|
Research Institution | The University of Tokyo |
Principal Investigator |
小池 祐太 東京大学, 大学院数理科学研究科, 准教授 (80745290)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 高頻度データ / 高次元共分散推定 / graphical Lasso / 高次元データ / 多重検定 / ネットワーク解析 |
Outline of Annual Research Achievements |
本年度は、前年度の予定通り、S&P500指数構成銘柄の高頻度データを用いて、その精度行列に対する統計推測を実行し、これら銘柄間のネットワーク構造の解析を行った。よく知られているように、金融資産価格はクロスセクションでファクター構造を有しているため、その精度行列自体はスパースにはなりえない。前年度開発した統計理論は精度行列のスパース性を前提としているため、そのままでは適用できない。しかし、ファクターに起因する変動を取り除いた残差系列の精度行列はスパースであることが期待され、前年度開発した理論はそのような設定も許容するため、ここではS&P500指数(厳密にはSPDR S&P500 ETF)をファクターとしてそこから起因する変動を取り除いた残差系列の精度行列に対する統計推測を実行した。精度行列の点推定に用いるweighted graphical Lassoでは、一般には精度行列のsupport recovery (ゼロ成分の特定)は完全には保証されておらず、しばしば冗長な推定結果を与える。今回の分析結果でもその現象が観察されたため、前年度に開発したde-biased versionの漸近混合正規性に基づく有意性の評価によってゼロ成分の特定を試みた。しかし、ここで多重検定の問題が生じるため、よく知られるいくつかの対処法を試して結果を検討した。利用する方法によって結果にブレが生じるため、どの方法がよいのか今後検討する必要がある。妥当そうな結果に基づいてネットワーク構造のグラフを作成したところ、業種の構造がかなり反映されており、ある程度信憑性のある結果となった。また、ネットワーク解析の分野でよく行われる分析をいくつか適用し、得られたネットワークにはスケールフリー性がありそうだということが示唆された。しかし、分析方法によって結果にブレが生じるため、もう少し吟味する必要がある。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
前年度に立てた計画通り、実際の金融高頻度データに対して開発した統計理論を適用してネットワーク構造を解析することができ、結果自体は不十分ながらもある程度今後の研究につながるフィードバックを得られたため。
|
Strategy for Future Research Activity |
今年度の研究でわかった通り、利用する多重検定法によって精度行列の非ゼロ成分の識別結果にかなりのブレが生じる。多くの多重検定法は、特に高次元データでは保守的すぎるため、そのような方法を適用してしまうと本来非ゼロとすべき成分をゼロとしてしまうリスクが高まることがこの原因であると予想される。この問題を解決するアプローチとして、(1) より保守的でない多重検定法(Romono-Wolf法やFDRをコントロールする方法)の利用、(2) サンプル数を増やす、という方策が考えられる。(1)ではそれらの方法を正当化するための統計理論、特に高次元漸近論の開発が、(2)では生の金融高頻度データを用いることで生じる諸問題(観測の非同期性、マーケット・マイクロストラクチャーノイズなど)への対処が必要となる。これらの問題に取り組むことを計画している。
|
Causes of Carryover |
新型コロナウイルス感染症の拡大の影響で、本年度に参加する予定だったすべての研究集会が延期・キャンセル・オンライン開催のいずれかとなり、旅費が全く不要となったため、その分の次年度使用額が生じた。次年度も引き続き同様の状況がしばらく続くことが予想されるため、状況を注視しつつ、不要となった旅費については新規の金融高頻度データの購入にあてることを計画している。
|