• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Estimating the repayment capacity of the default company based on the credit information of multiple banks and developing its machine learning method

Research Project

Project/Area Number 23K22160
Project/Area Number (Other) 22H00889 (2022-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2022-2023)
Section一般
Review Section Basic Section 07080:Business administration-related
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

山下 智志  統計数理研究所, 学際統計数理研究系, 教授 (50244108)

Co-Investigator(Kenkyū-buntansha) XUE Yujie  統計数理研究所, リスク解析戦略研究センター, 特任助教 (20822232)
小池 祐太  東京大学, 大学院数理科学研究科, 准教授 (80745290)
田上 悠太  東京海洋大学, 学術研究院, 准教授 (60805050)
力丸 佑紀  北里大学, 未来工学部, 准教授 (80736009)
中西 正  北海道大学, 経済学研究院, 助教 (30967203)
Project Period (FY) 2022-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥15,600,000 (Direct Cost: ¥12,000,000、Indirect Cost: ¥3,600,000)
Fiscal Year 2025: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2024: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2023: ¥5,980,000 (Direct Cost: ¥4,600,000、Indirect Cost: ¥1,380,000)
Fiscal Year 2022: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Keywords信用リスク / 企業財務データ / デフォルト後損失 / LGD / 担保、保証データ / 中小企業金融 / LDG / 回収率 / 機械学習 / ロジットモデル / 担保、保証 / 機械学習的アプローチ / 担保 / 保証 / デフォルト
Outline of Research at the Start

大手地銀5行の融資全数データを統合し、既存の機械学習を改良しデフォルト確率だけでなくデフォルト後の経営状態の推移や返済能力を評価する方法を構築する。それにより正確な信用リスクの算出や銀行の最適戦略立案、政策の有効性検証を可能とする。
我々は2008年よりに複数の大手地銀の全融資データベースの構造化をしており、これに独自開発した機械学習的アプローチを適用することにより、モデル化を行う。特に金融機関への実装を意識し、返済行動の不連続性や信用スコアに対する説明可能性を重視する。その成果は信用リスク研究の発展、銀行の融資審査の高度化、金融行政の合理化、中小企業金融の円滑化に貢献する。

Outline of Annual Research Achievements

本研究は大手地銀5行の融資全数データを統合し、デフォルト確率だけでなくデフォルト後の経営状態の推移や返済能力を評価する方法を構築する。それによって、正確な信用リスクの算出や銀行の最適戦略立案、政策の有効性検証を可能とする。信用リスク評価はバーゼル規制やIFRSの導入に伴い、デフォルト後の返済能力を含めて算出ことが必要となった。ただ、返済履歴データや担保、保証データは秘匿性が高いため、国際的にも研究が進んでいない。我々は2008年より複数の地方銀行の融資データの構造化しており、これに独自に開発した機械学習的アプローチを適用することにより、モデル化を行う。特に、金融機関への実装を意識し、返済行動の不連続性や、従来のAIではできなかった信用スコアに対する説明可能性を重視する。その成果は信用リスク研究の発展、銀行の融資審査の高度化、金融行政の合理化、中小企業金融の円滑化に貢献する。
信頼性の高いLGD予測AIを開発するために、本研究はデータベースの構造化、理論研究、パラメータ推計、仮説検証のフェーズから構成される。(a) 要因分析の充実、(b) 予測精度の追及、(c) 要因分析の充実と(b) 予測精度の追及の両立の3段階に分割した目的を設定した。
本年度は前年度の(a)および(b)に関する研究成果を利用し、(b)の精度の向上を中心に行った。特に、機械学習ではない統計的手法にも取り組み、新たなアプローチ方法を提案須津ことができた。
本年度途中で、コンソーシアムメンバーの伊予銀行がデータフォーマットの特殊事情により脱退し、コンソーシアム参加メンバーは4行になった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

信頼性の高いLGD予測AIを開発するために、本研究はデータベースの構造化、理論研究、パラメータ推計、仮説検証のフェーズから構成される。(a) 要因分析の充実、(b) 予測精度の追及、(c) 要因分析の充実と(b) 予測精度の追及の両立の3段階に分割した目的を設定した。本年度はこのうち(a)と(b)の一部を重点的に遂行した。
(a)にかんして、機械学習てきアプローチについては前年度の研究の精度向上が主なテーマであった。とくにXAI手法のうち、どのような種類のモデルに対しても同じ手法を適用が可能なモデル非依存(Model-Agnostic)な手法を用いる。多様なモデルの解釈性を比較する本研究に適した手法だからである。基礎的統計モデル(線形回帰やTobit model)をベンチマークモデルとして用い、予測精度の評価としては「アウトオブタイムにおける修正済み決定係数/平均絶対誤差/平均二乗誤差」を評価指標とするbootstrap 交差検証を行った。基礎的統計モデル/発展的機械学習/これまでのアンサンブルを用いたとき、各々のモデルの予測精度とその要因を解明する。発展的機械学習としては、構造化された表形式のデータstructured dataもしくはtabular data)に対する有効性が示されている、発展的木構造モデル(Adaboost/勾配ブースティング木)および発展的ニューラルネットワーク(Neural Oblivious Decision Ensembles (NODE)、Tab Net、Mixture Density Networks (MDN)等)を用いた。
さらに予測精度の向上と要因分析の正確さを追求し、ロジットモデルを中心に統計的手法も導入した。デフォルトー毀損ーLDGの3段階ロジットモデルであるが、3段階目だけが連続のモデルであるため、統計学的に精緻な議論が必要であった。

Strategy for Future Research Activity

(a)の要因分析については、銀行の実務に実装するに当たって、要因が人間の直感に容易にリンクする統計的手法と、説明に発展的な手法が必要となる機械学習の両面からのアプローチを試みる。統計モデルと機械学習の長所を合理的な方法で再構築し、精度の高い(機械学習)結果を踏襲しながら、理解しやすい(統計的手法)アウトプットをデータ提供者(4地方銀行)に示すことを目的とする。そのため、4行と行っているコンソーシアムの活動を活発化させ、要因分析に対するニーズを再確認する。
(b) 予測精度の追及
(b-1) 発展的ニューラルネットワークに議論を限定した。理由は、(i)本研究のような構造化された表形式データに対するニューラルネットワークが発展してきたのは最近であり、様々な手法が玉石混交状態であるため、(ii) ニューラルネットワークの解釈性においてモデル依存な様々な手法(特徴量の可視化(Feature Visualization)/敵対的サンプル(Adversarial Examples)/概念(Concepts)/特徴量の帰属(Feature Attribution)/モデル蒸留(Modell Distillation))のように特に発展しているためである。一方、銀行における実装を考慮し、銀行にとっての「予測精度」とは何なのかを予測の目的から推計する方法を議論する。それによって、銀行にとっての「期待効用」を導くことができ、期待効用最大化によって意思決定(この場合は信用審査の方法論)に繋ぐことを試みる。

Report

(2 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • Research Products

    (17 results)

All 2024 2023 2022

All Journal Article (2 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (15 results) (of which Int'l Joint Research: 4 results,  Invited: 7 results)

  • [Journal Article] Concentration inequality and the weak law of large numbers for the sum of partly negatively dependent <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" altimg="si5.svg" display="inline" id="d1e23"><mml:mi>φ</mml:mi></mml:math>-subgaussian random variables2024

    • Author(s)
      Tanoue Yuta
    • Journal Title

      Statistics &amp; Probability Letters

      Volume: 206 Pages: 109979-109979

    • DOI

      10.1016/j.spl.2023.109979

    • Related Report
      2023 Annual Research Report 2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Sharp high-dimensional central limit theorems for log-concave distributions2023

    • Author(s)
      Fang Xiao、Koike Yuta
    • Journal Title

      Annales de l'Institut Henri Poincare, Probabilites et Statistiques

      Volume: 2023 Pages: 1-20

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Estimation of the number of relevant factors from high-frequency data2024

    • Author(s)
      小池祐太
    • Organizer
      2023年度関西計量経済学研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Estimation of the number of relevant factors from high-frequency data2024

    • Author(s)
      Yuta Koike
    • Organizer
      Stochastic Analysis and Statistics 2024
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Bootstrap test for multi-scale lead-lag relationships in high-frequency data2023

    • Author(s)
      Yuta Koike
    • Organizer
      The 12th ICSA International Conference
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Estimation of the number of relevant factors from high-frequency data2023

    • Author(s)
      Yuta Koike
    • Organizer
      16th International Conference of the ERCIM WG on Computational and Methodological Statistics (CMStatistics 2023)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] アマゾンウェブサービスとDaily TAQデータ2023

    • Author(s)
      小池祐太
    • Organizer
      探索的ビッグデータ解析と再現可能研究 (WS-EBDA-RR-2023)
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] Estimation of the number of relevant factors from high-frequency data2023

    • Author(s)
      小池祐太
    • Organizer
      データサイエンスにおける統計的理論・方法論の新展開
    • Related Report
      2023 Annual Research Report
  • [Presentation] 空間回帰モデルにおける最尤推定量の一致性2023

    • Author(s)
      力丸佑紀, 柴田里程
    • Organizer
      統計関連学会連合大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 多変量時系列のTextilePlot2023

    • Author(s)
      力丸佑紀, 柴田里程
    • Organizer
      統計関連学会連合大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 金融工学・数理ファイナンスと金融政策のこれまで2023

    • Author(s)
      山下智志
    • Organizer
      統計数理研究所オープンハウス公開講演会
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 大規模財務データと融資信用データを用いた企業経営状況分析:中小企業にあたえたコロナのマグニチュード2022

    • Author(s)
      山下智志, 力丸佑紀, 中西正, 長幡英明, 吉澤史晃
    • Organizer
      統計関連学会連合大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] データ多様化時代のミクロデータ結合技術と社会実装について2022

    • Author(s)
      山下智志, 高部勲
    • Organizer
      生命保険文化センター保険研究室特別研究会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 金融高頻度データにおける先行遅行関係2022

    • Author(s)
      小池祐太
    • Organizer
      統計数理研究所リスク解析戦略研究センターシンポジウム
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] ティックデータのフィルタリング: Daily TAQデータを例にして2022

    • Author(s)
      小池祐太
    • Organizer
      探索的ビッグデータ解析と再現可能研究(WS-EBDA-RR-2022)
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] 空間ラグモデルの問題とその解決策2022

    • Author(s)
      力丸佑紀, 柴田里程
    • Organizer
      統計関連学会連合大会
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] 多ソース多サイトデータの活用2022

    • Author(s)
      力丸佑紀, 柴田里程, 山下智志
    • Organizer
      統計関連学会連合大会
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi