2020 Fiscal Year Research-status Report
地銀統合データベースを用いた実務利用可能な高精度LGD推定モデルの開発
Project/Area Number |
18K12873
|
Research Institution | Waseda University |
Principal Investigator |
田上 悠太 早稲田大学, 商学学術院(ビジネス・ファイナンス研究センター), 助教 (60805050)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 信用リスク / LGD / 転移学習 |
Outline of Annual Research Achievements |
転移学習はある特定の学習課題に対して、それに類似した学習課題での学習成果を応用する方法である。機械学習、人工知能分野で用いられる手法であり、デフォルト予測問題など金融分野を含め様々な分野で成果が報告されている。本年度は昨年度に引き続き、LGD推定問題に転移学習を応用することでモデルの推定精度の向上を試みた。また、転移学習に類似した手法であるファインチューニングも試み、LGD推定において、いわゆるターゲットドメインのデータ以外を用いることで推定精度が向上するのか研究を行った。転移学習では、まず学習データを用いてディープニューラルネットワークモデルを作成、そのモデルに新しい層を追加したモデルをターゲットドメインのデータで学習する方法を試みた。学習使うデータ、転移先のデータの組み合わせとして、(1)ソースドメインのデータに加えて、ターゲットドメインのデータを加えたデータを学習データとして、ターゲットドメインのデータに対して転移を試みる方法、(2)学習に使うデータとしてソースドメインのデータのみを学習データとして用いて、ターゲットドメインのデータに対して転移する方法の2つを試みた。また、ディープニューラルネットワークモデルを用いるものの他にBaggingをベースにしたモデルによる転移学習も試みた。転移学習のソース、ターゲットの切り分けには、(ア)業種、(イ)銀行、(ウ)貸し出し地域、(エ)与信額、(オ)利益率、(カ)売上規模、(キ)従業員数など様々な基準を用いた。同様に、ディープニューラルネットワークによるファインチューニングも行った。学習による推定精度の向上を、(い)ターゲットドメインだけのデータによるモデル、(ろ)ターゲットドメイン、ソースドメインの両方のデータを集めたモデルによる結果と比較した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
比較の結果、一部の組み合わせに関しては転移学習、ファインチューニングによって推定精度の向上が見られた。しかし、多くの場合には点に学習による推定精度の大きな向上は見られなかった。推定精度の向上が見られたのは、平均的なターゲットドメインのデータに対してである。つまり、ソースドメインと大きな差が見られない場合には推定精度の向上が見られた。推定精度の向上はデータ数の増加によるものであると考えられる。LGD推定問題においては、ナイーブな転移学習、ファインチューニングによる大きな推定精度の向上は期待できないことが確認できた。ただ、以下の今後の方策で説明するように、LGD推定精度の向上のための方策は残されているが、これらの点については検討できていないため、進捗は遅れている。
|
Strategy for Future Research Activity |
来年度は、データの時系列方向の情報をモデルに取り入れることで、推定精度の向上を試みる。具体的には、(1)システマチックファクター、つまりマクロ経済状態による影響の分析、検証とそれらを用いた推定精度の向上を目指す。海外の研究において考える債権の種類、国によって異なるものの、システマチックファクターがLGDに影響を与えることが示されている。また、システマチックファクターの影響をマクロ経済変数で補正する方法が提案されている。そこで、これらの研究を参考にして、システマチックファクターの影響、その補正について研究し、推定精度向上を目指す。、(2)データベースはパネルデータなので、パネルデータの特徴を生かして、デフォルト以前の状態を取り入れ推定精度の向上を目指す。これまでの研究ではデータをクロスセクショナルナデータとして扱ってLGD推定を行ってきた。ただ、データベースはパネルデータであるので、その特徴を活かすことで推定精度の向上が期待できると考えられる。そこで、例えば関数回帰モデルなどの手法を用いることを検討している。
|
Causes of Carryover |
コロナウィルス感染症の影響で予定していた国際学会を含む出張で利用する予定だった費用を使わなかったため。また、予定していた論文執筆に伴う、英文校正ひ出版費に関しても研究の遅れによって使わなかったため。
|