• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

複数の銀行の与信情報によるデフォルト企業の返済能力推計とその機械学習的方法の開発

研究課題

研究課題/領域番号 22H00889
配分区分補助金
研究機関統計数理研究所

研究代表者

山下 智志  統計数理研究所, 学際統計数理研究系, 教授 (50244108)

研究分担者 田上 悠太  早稲田大学, 商学学術院(ビジネス・ファイナンス研究センター), 助教 (60805050)
力丸 佑紀  統計数理研究所, リスク解析戦略研究センター, 特任准教授 (80736009)
小池 祐太  東京大学, 大学院数理科学研究科, 准教授 (80745290)
中西 正  統計数理研究所, リスク解析戦略研究センター, 特任助教 (30967203)
研究期間 (年度) 2022-04-01 – 2026-03-31
キーワード信用リスク / 中小企業金融 / LGD / デフォルト後損失 / 回収率 / 担保、保証 / 機械学習
研究実績の概要

本研究は大手地銀5行の融資全数データを統合し、デフォルト確率だけでなくデフォルト後の経営状態の推移や返済能力を評価する方法を構築する。それによって、正確な信用リスクの算出や銀行の最適戦略立案、政策の有効性検証を可能とする。信用リスク評価はバーゼル規制やIFRSの導入に伴い、デフォルト後の返済能力を含めて算出ことが必要となった。ただ、返済履歴データや担保、保証データは秘匿性が高いため、国際的にも研究が進んでいない。我々は2008年より複数の地方銀行の融資データの構造化しており、これに独自に開発した機械学習的アプローチを適用することにより、モデル化を行う。特に、金融機関への実装を意識し、返済行動の不連続性や、従来のAIではできなかった信用スコアに対する説明可能性を重視する。その成果は信用リスク研究の発展、銀行の融資審査の高度化、金融行政の合理化、中小企業金融の円滑化に貢献する。
本研究の目的は、信頼性の高いLGD予測AIを開発するために、上記の4つの問いに答えることである。本研究はデータベースの構造化、理論研究、パラメータ推計、仮説検証のフェーズから構成される。(a) 要因分析の充実、(b) 予測精度の追及、(c) 要因分析の充実と(b) 予測精度の追及の両立の3段階に分割した目的を設定した。本年度はこのうち(a)と(b)の一部を重点的に遂行した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

(a)XAI手法のうち、どのような種類のモデルに対しても同じ手法を適用が可能なモデル非依存(Model-Agnostic)な手法を用いる。多様なモデルの解釈性を比較する本研究に適した手法だからである。基礎的統計モデル(線形回帰やTobit model)をベンチマークモデルとして用い、予測精度の評価としては「アウトオブタイムにおける修正済み決定係数/平均絶対誤差/平均二乗誤差」を評価指標とするbootstrap 交差検証を行った。基礎的統計モデル/発展的機械学習/これまでのアンサンブルを用いたとき、各々のモデルの予測精度とその要因を解明する。発展的機械学習としては、構造化された表形式のデータstructured dataもしくはtabular data)に対する有効性が示されている、発展的木構造モデル(Adaboost/勾配ブースティング木)および発展的ニューラルネットワーク(Neural Oblivious Decision Ensembles (NODE)、Tab Net、Mixture Density Networks (MDN)等)を用いた。
(b) 予測精度の追及
(b-1) 発展的ニューラルネットワークに議論を限定した。理由は、(i)本研究のような構造化された表形式データに対するニューラルネットワークが発展してきたのは最近であり、様々な手法が玉石混交状態であるため、(ii) ニューラルネットワークの解釈性においてモデル依存な様々な手法(特徴量の可視化(Feature Visualization)/敵対的サンプル(Adversarial Examples)/概念(Concepts)/特徴量の帰属(Feature Attribution)/モデル蒸留(Modell Distillation))のように特に発展しているためである。

今後の研究の推進方策

金融機関への実装を意識し、返済行動の不連続性や、従来のAIではできなかった信用スコアに対する説明可能性を重視する。その成果は信用リスク研究の発展、銀行の融資審査の高度化、金融行政の合理化、中小企業金融の円滑化に貢献する。
信頼性の高いLGD予測AIを開発するために、本研究はデータベースの構造化、理論研究、パラメータ推計、仮説検証のフェーズから構成される。(a) 要因分析の充実、(b) 予測精度の追及、(c) 要因分析の充実と(b) 予測精度の追及の両立の3段階に分割した目的を設定した。
とくに(a)の要因分析の結果を(b)(c)(d)に正確に反映させるような、分析手法と評価関数の設定に注力する。これはその先にあるモデルの社会実装(データ提供者である、地方銀行5行に対する義務的サービス)をするためには必須の作業であることをこれまでに確認した。そのため、データの性質に添った実用的な分析手法の開発や、その実行のためのデータの前処理、さらには変数の定義を銀行の実務にあうように変更するなどの作業が必要である。そのため研究コンソーシアムにおける双方向の意思疎通を重視した研究を遂行する予定である。

  • 研究成果

    (8件)

すべて 2024 2023 2022

すべて 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 2件) 学会発表 (6件) (うち国際学会 1件、 招待講演 3件)

  • [雑誌論文] Concentration inequality and the weak law of large numbers for the sum of partly negatively dependent φ-subgaussian random variables.2024

    • 著者名/発表者名
      Yuta Tanoue
    • 雑誌名

      Statistics & Probability Letters

      巻: 206 ページ: -

    • DOI

      10.1016/j.spl.2023.109979

    • 査読あり / オープンアクセス
  • [雑誌論文] Sharp high-dimensional central limit theorems for log-concave distributions2023

    • 著者名/発表者名
      Fang Xiao、Koike Yuta
    • 雑誌名

      Annales de l'Institut Henri Poincare, Probabilites et Statistiques

      巻: 2023 ページ: 1-20

    • DOI

      10.48550/arXiv.2207.14536

    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] 大規模財務データと融資信用データを用いた企業経営状況分析:中小企業にあたえたコロナのマグニチュード2022

    • 著者名/発表者名
      山下智志, 力丸佑紀, 中西正, 長幡英明, 吉澤史晃
    • 学会等名
      統計関連学会連合大会
  • [学会発表] データ多様化時代のミクロデータ結合技術と社会実装について2022

    • 著者名/発表者名
      山下智志, 高部勲
    • 学会等名
      生命保険文化センター保険研究室特別研究会
  • [学会発表] 金融高頻度データにおける先行遅行関係2022

    • 著者名/発表者名
      小池祐太
    • 学会等名
      統計数理研究所リスク解析戦略研究センターシンポジウム
    • 招待講演
  • [学会発表] ティックデータのフィルタリング: Daily TAQデータを例にして2022

    • 著者名/発表者名
      小池祐太
    • 学会等名
      探索的ビッグデータ解析と再現可能研究(WS-EBDA-RR-2022)
    • 招待講演
  • [学会発表] 空間ラグモデルの問題とその解決策2022

    • 著者名/発表者名
      力丸佑紀, 柴田里程
    • 学会等名
      統計関連学会連合大会
    • 国際学会 / 招待講演
  • [学会発表] 多ソース多サイトデータの活用2022

    • 著者名/発表者名
      力丸佑紀, 柴田里程, 山下智志
    • 学会等名
      統計関連学会連合大会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi