近年、データサイエンスの発展に伴い、大量のデータを積極的に用いて、柔軟性が高い機械学習の技術をファイナンスの実証分析にも適用することが盛んに行われるようになった。その結果、伝統的で簡素な予測モデルよりもリターンの予測力が向上することが多数報告されている。一方で、予測変数やアルゴリズムをマイニングすることによって、分析者自身でさえも意図せずに、偶然にアウトオブサンプルに適合するという偽発見の可能性も高まるという弊害もある。 前年度までに得られた成果をもとにさらに研究を進捗させた。多数の企業特性を予測変数として、これらの組み合わせをランダムに抽出することによって、株価リターンの予測の精度を検証したところ、機械学習モデルは簡素な線形モデルと比べて平均的には予測精度が変わらないことを得た。つまり、多くの予測変数を用いたとしても、機械学習でリターンを予測することは容易でなく、報告されている既存研究は偽発見である可能性が高いことが示唆される。一方で、多重検定の枠組みで検定した結果、一部には偶然とはいえない予測力を持つものが一定程度存在する。これは、予測変数と期待リターンとの間の非線形な関係や予測変数間の相互作用を機械学習によって捕捉できることを示唆している。 また、これまでさほど探究されていない、機械学習の技術を為替市場に適用した分析も行った。従来からよく知られるファクターを予測変数に用いることによりデータスヌーピングのバイアスを避け、オーバーフィッティングの悪影響に対処した。この結果、決定係数は低くても予測に基づく戦略のリターンは高いこと、アンサンブル学習によって予測力が高まることなどを得た。 さらに、通貨のファクター・プレミアムや労働収入リスクを考慮した最適ポートフォリオに関する研究や、ESGファクターを考慮したファクターモデルに関する研究も行い、論文原稿を執筆中である。
|