• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Development of missing value complement / outlier treatment method for large scale financial database for corporate credit risk evaluation

Research Project

Project/Area Number 15H03390
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

山下 智志  統計数理研究所, データ科学研究系, 教授 (50244108)

Co-Investigator(Kenkyū-buntansha) 野間 久史  統計数理研究所, データ科学研究系, 准教授 (70633486)
Project Period (FY) 2015-04-01 – 2019-03-31
Keywords欠損値補間 / 異常値修正 / データクレンジング / データ結合 / 信用データ / 財務データ / 不動産データ / 公的ミクロデータ
Outline of Annual Research Achievements

欠損値や異常値が存在する不完全なデータに対する、データクレンジング手法については多くの研究成果がある。しかしそれらの成果は、一定の数学的仮説のもとに成り立つ方法論であり、実際のデータに対して適用可能であるとは限らない。2000年以降は、現実のデータの特性を踏まえた、特定分野を前提としたデータクレンジング手法の提案がなされている。一方、経営財務データについて統合・ビッグデータ化を行っているが、データクレンジング手法の研究は少ない。本研究では、統計学や生物・医療分野で発達した欠損値異常値処理を財務データへの適用を検討し、財務データ特有の性質を基にした新たな手法を開発する。具体的には、CRD協会データや地銀5行の財務・与信データ、政府調査のミクロデータ、不動産賃貸業データに適用する。これらの正常化されたデータベースのうち、
秘匿性の低いデータベースについては研究用に公開する。さらに昨年度から法人統計・事業所統計などの政府データと上記の企業データとの結合に関する方法論を研究し、高い精度のデータ結合を実現した。また、アルゴリズムの開発により実用的な速度でデータベース結合を可能とした。これによって企業の全数データである政府統計データと、サンプル標本ではあるが高質である信用データを基にした、企業プロファイリングが可能となった。
1.欠損値異常値に関する既存研究のサーベイ。2.医療系データベースに対して、データクレンジング手法を適用。3.経営・経済系のデータベースに対する、データクレンジング手法の適用。4.高度信用リスクデータベースの作成。5.統計モデルによる期待損失モデルの構築。6.賃貸不動産収益・リスクデー
タベースの作成。7.政府データと信用データの結合。

Research Progress Status

平成30年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

平成30年度が最終年度であるため、記入しない。

  • Research Products

    (9 results)

All 2018

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 2 results) Presentation (5 results) (of which Invited: 3 results) Funded Workshop (1 results)

  • [Journal Article] 多項ロジットモデル及び主成分分析を用いた新たな統計的マッチング手法の提案2018

    • Author(s)
      高部勲, 山下智志
    • Journal Title

      統計学

      Volume: 115 Pages: 1-18

    • Peer Reviewed / Open Access
  • [Journal Article] B-スプライン及びAdaptive Group LASSOに基づく正則化非線形ロジットモデルによるデフォルト確率の推定2018

    • Author(s)
      高部勲, 山下智志
    • Journal Title

      統計数理

      Volume: 66-2 Pages: 295-317

    • Peer Reviewed / Open Access
  • [Journal Article] 多項ロジットモデルに基づく企業データの統計的マッチング(企業分析)2018

    • Author(s)
      高部勲、山下智志
    • Journal Title

      JAFEEプロシーディングス

      Volume: 2018年度夏 Pages: 1-8

    • Peer Reviewed
  • [Presentation] AIと機械学習の直感的理解と金融への応用2018

    • Author(s)
      山下智志
    • Organizer
      日本銀行金融機構局金融高度化センターWS
    • Invited
  • [Presentation] ビッグデータ時代におけるデータベース結合の目的・方法・効果2018

    • Author(s)
      山下智志
    • Organizer
      2018年度統計関連学会連合大会
  • [Presentation] ビッグデータ時代における企業データの統計的名寄せ手法2018

    • Author(s)
      山下智志
    • Organizer
      統計数理研究所第6回金融シンポジウム
    • Invited
  • [Presentation] 多項ロジットモデルに基づく企業データの統計的マッチング(理論的側面)2018

    • Author(s)
      高部勲, 山下智志
    • Organizer
      日本分類学会第37回大会
  • [Presentation] 金融業における企業プロファイリングデータベースの作成と政府データ2018

    • Author(s)
      山下智志, 高部勲
    • Organizer
      政府統計ミクロデータの構造化と研究利用プラットフォームの形成研究集会
    • Invited
  • [Funded Workshop] 第10回国際ミクロデータラボラトリーサークショップ2018

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi