2022 Fiscal Year Annual Research Report
実務利用可能な中小企業の期待損失率推計手法の開発:地銀統合ビッグデータを用いて
Project/Area Number |
20K13581
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
長幡 英明 統計数理研究所, リスク解析戦略研究センター, 客員准教授 (00815128)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 信用リスク / 機械学習 / 転移学習 / データ構造化 |
Outline of Annual Research Achievements |
デフォルト時貸出残高損失率(LGD)推計用のデータベースを用いて、統計モデル・機械学習による最適な推計モデル構築だけでなく、さらなる上流段階にあたる「推計用データベースデータ構造化」に着眼し、推計精度向上に寄与するようなデータ構造化の実現を目指した。また、その着想原点にあたる従属誤差に対する数理統計学の理論構築も実験成功に寄与した。データ構造化について、具体的には「デフォルト時点からt時点前」 「デフォルト時点からt時点後」も含めたデータ構造化を行った。推定精度の向上のため、デフォルト関連情報をより深く・広範囲に取り込めることから、統計モデルや機械学習の学習による推計に有効であることが確認された。また、推計モデルとしては、ゼロ過剰な連続データのための2段階モデル・ガウス過程・ランダムフォレスト・ガウス過程による特徴量生成を経由したランダムフォレストなどの独自の機械学習を用いた実験を実施した。最終年度は、前年の実験結果の失敗を受け、統計モデルや機械学習の高度化によるLGD推計精度の向上だけではなく、推計に用いるデータベースから見直した点が推計精度向上や新たな知見の獲得を重視するようにピボットした結果、明確な進捗を得られたと考えている。なお、時間情報を取り入れる発想の原点として、従属誤差に対するANOVAの理論構築に触れていた側面が大きい。より自然な仮定を課したモデルに対して理論構築する経験が、実データに対して自然な特徴量生成とデータ構造化の成功を促した。
|