研究課題/領域番号 |
23K22160
|
補助金の研究課題番号 |
22H00889 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分07080:経営学関連
|
研究機関 | 統計数理研究所 |
研究代表者 |
山下 智志 統計数理研究所, 学際統計数理研究系, 教授 (50244108)
|
研究分担者 |
XUE Yujie 統計数理研究所, リスク解析戦略研究センター, 特任助教 (20822232)
小池 祐太 東京大学, 大学院数理科学研究科, 准教授 (80745290)
田上 悠太 東京海洋大学, 学術研究院, 准教授 (60805050)
力丸 佑紀 北里大学, 未来工学部, 准教授 (80736009)
中西 正 北海道大学, 経済学研究院, 助教 (30967203)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
15,600千円 (直接経費: 12,000千円、間接経費: 3,600千円)
2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2023年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2022年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 信用リスク / 企業財務データ / デフォルト後損失 / LGD / 担保、保証データ / 中小企業金融 / LDG / 回収率 / 機械学習 / ロジットモデル / 担保、保証 / 機械学習的アプローチ / 担保 / 保証 / デフォルト |
研究開始時の研究の概要 |
大手地銀5行の融資全数データを統合し、既存の機械学習を改良しデフォルト確率だけでなくデフォルト後の経営状態の推移や返済能力を評価する方法を構築する。それにより正確な信用リスクの算出や銀行の最適戦略立案、政策の有効性検証を可能とする。 我々は2008年よりに複数の大手地銀の全融資データベースの構造化をしており、これに独自開発した機械学習的アプローチを適用することにより、モデル化を行う。特に金融機関への実装を意識し、返済行動の不連続性や信用スコアに対する説明可能性を重視する。その成果は信用リスク研究の発展、銀行の融資審査の高度化、金融行政の合理化、中小企業金融の円滑化に貢献する。
|
研究実績の概要 |
本研究は大手地銀5行の融資全数データを統合し、デフォルト確率だけでなくデフォルト後の経営状態の推移や返済能力を評価する方法を構築する。それによって、正確な信用リスクの算出や銀行の最適戦略立案、政策の有効性検証を可能とする。信用リスク評価はバーゼル規制やIFRSの導入に伴い、デフォルト後の返済能力を含めて算出ことが必要となった。ただ、返済履歴データや担保、保証データは秘匿性が高いため、国際的にも研究が進んでいない。我々は2008年より複数の地方銀行の融資データの構造化しており、これに独自に開発した機械学習的アプローチを適用することにより、モデル化を行う。特に、金融機関への実装を意識し、返済行動の不連続性や、従来のAIではできなかった信用スコアに対する説明可能性を重視する。その成果は信用リスク研究の発展、銀行の融資審査の高度化、金融行政の合理化、中小企業金融の円滑化に貢献する。 信頼性の高いLGD予測AIを開発するために、本研究はデータベースの構造化、理論研究、パラメータ推計、仮説検証のフェーズから構成される。(a) 要因分析の充実、(b) 予測精度の追及、(c) 要因分析の充実と(b) 予測精度の追及の両立の3段階に分割した目的を設定した。 本年度は前年度の(a)および(b)に関する研究成果を利用し、(b)の精度の向上を中心に行った。特に、機械学習ではない統計的手法にも取り組み、新たなアプローチ方法を提案須津ことができた。 本年度途中で、コンソーシアムメンバーの伊予銀行がデータフォーマットの特殊事情により脱退し、コンソーシアム参加メンバーは4行になった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
信頼性の高いLGD予測AIを開発するために、本研究はデータベースの構造化、理論研究、パラメータ推計、仮説検証のフェーズから構成される。(a) 要因分析の充実、(b) 予測精度の追及、(c) 要因分析の充実と(b) 予測精度の追及の両立の3段階に分割した目的を設定した。本年度はこのうち(a)と(b)の一部を重点的に遂行した。 (a)にかんして、機械学習てきアプローチについては前年度の研究の精度向上が主なテーマであった。とくにXAI手法のうち、どのような種類のモデルに対しても同じ手法を適用が可能なモデル非依存(Model-Agnostic)な手法を用いる。多様なモデルの解釈性を比較する本研究に適した手法だからである。基礎的統計モデル(線形回帰やTobit model)をベンチマークモデルとして用い、予測精度の評価としては「アウトオブタイムにおける修正済み決定係数/平均絶対誤差/平均二乗誤差」を評価指標とするbootstrap 交差検証を行った。基礎的統計モデル/発展的機械学習/これまでのアンサンブルを用いたとき、各々のモデルの予測精度とその要因を解明する。発展的機械学習としては、構造化された表形式のデータstructured dataもしくはtabular data)に対する有効性が示されている、発展的木構造モデル(Adaboost/勾配ブースティング木)および発展的ニューラルネットワーク(Neural Oblivious Decision Ensembles (NODE)、Tab Net、Mixture Density Networks (MDN)等)を用いた。 さらに予測精度の向上と要因分析の正確さを追求し、ロジットモデルを中心に統計的手法も導入した。デフォルトー毀損ーLDGの3段階ロジットモデルであるが、3段階目だけが連続のモデルであるため、統計学的に精緻な議論が必要であった。
|
今後の研究の推進方策 |
(a)の要因分析については、銀行の実務に実装するに当たって、要因が人間の直感に容易にリンクする統計的手法と、説明に発展的な手法が必要となる機械学習の両面からのアプローチを試みる。統計モデルと機械学習の長所を合理的な方法で再構築し、精度の高い(機械学習)結果を踏襲しながら、理解しやすい(統計的手法)アウトプットをデータ提供者(4地方銀行)に示すことを目的とする。そのため、4行と行っているコンソーシアムの活動を活発化させ、要因分析に対するニーズを再確認する。 (b) 予測精度の追及 (b-1) 発展的ニューラルネットワークに議論を限定した。理由は、(i)本研究のような構造化された表形式データに対するニューラルネットワークが発展してきたのは最近であり、様々な手法が玉石混交状態であるため、(ii) ニューラルネットワークの解釈性においてモデル依存な様々な手法(特徴量の可視化(Feature Visualization)/敵対的サンプル(Adversarial Examples)/概念(Concepts)/特徴量の帰属(Feature Attribution)/モデル蒸留(Modell Distillation))のように特に発展しているためである。一方、銀行における実装を考慮し、銀行にとっての「予測精度」とは何なのかを予測の目的から推計する方法を議論する。それによって、銀行にとっての「期待効用」を導くことができ、期待効用最大化によって意思決定(この場合は信用審査の方法論)に繋ぐことを試みる。
|