研究課題/領域番号 |
20K13581
|
研究機関 | 統計数理研究所 |
研究代表者 |
長幡 英明 統計数理研究所, リスク解析戦略研究センター, 特任助教 (00815128)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 信用リスク / 機械学習 / 転移学習 |
研究実績の概要 |
今年は、デフォルト時貸出残高損失率(LGD)推計用のデータベースを用いて、(a)統計モデル(b)機械学習による最適な推計モデル構築を目指した。具体的には、推定精度の向上のため転移学習を用いることを狙い、そのベースとなる学習済みニューラルネットワークの開発・次なるステップとして転移学習を試みた。転移学習とはある特定の学習課題に対し、それに類似した学習課題での学習成果を応用するもので、機械学習分野で用いられる手法であり、様々な分野で驚異的な成果が報告されている。しかし、信用リスク分野で転移学習を用いたケースは多くない。信用リスク分野では、デフォルト確率(PD)予測とLGDが研究対象となりうる。PD予測においては、大企業PD予測をソース学習とし、それを中小企業に転移することで、中小企業のPDの予測精度が向上することが示されている。これをLGD推定に応用することで、データが少ないことを克服できるのではないか、と考えた。背景としては、本研究で用いる地方銀行統合データベースは、他の研究に比べデータ数が多いものの、個別銀行に対する最適なモデルを作る際にはデータ数が減少してしまうことが挙げられる。実際に深層学習モデルのチューニングを行い、転移学習を試みた。具体的にはベイズ最適化やランダム最適化を用いてハイパーパラメータのチューニングをし、そうしてできた学習済みニューラルネットワークを用いて、統合データベースに含まれる複数銀行の統合モデルを作成し、複数銀行の統合モデルで学習した成果を個別銀行でのモデル作成に応用することで推定精度の向上を試みた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
そもそもベースとなるニューラルネットワークの推定結果が安定しなかった。モデルおよびデータベースに起因する問題が原因として考えられる。まず、モデルに起因する問題に関しては、深層学習を用いた転移学習は大量のパラメータが含まれており、自由度が非常に高いため学習が複雑であり、最適化が困難であった。そしてデータベースに起因する問題に関しては、一般にLGD推定においてはノイズが非常に大きいことが知られており、これは推定精度向上以前の問題として、推定の安定性が低く、モデル評価さえ困難であった。
|
今後の研究の推進方策 |
まず、モデルに起因する問題とデータベースに起因する問題のどちらが主問題かを切り分ける必要がある。ニューラルネットワーク以外に推定が安定しやすい統計モデルや機械学習手法を適用し、推定の安定性を確保する。この作業により、データベースに起因する推定の不安定さのベースラインをつくり、上述のニューラルネットワークモデルの推定の不安定さと比較することでどの程度モデルに起因する問題が推定の不安定さを招いているのか検証が可能だと考える。
|