• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

企業の信用力評価のための大規模財務データベースの欠損値補完・異常値処理方法の開発

研究課題

研究課題/領域番号 15H03390
研究機関統計数理研究所

研究代表者

山下 智志  統計数理研究所, データ科学研究系, 教授 (50244108)

研究分担者 野間 久史  統計数理研究所, データ科学研究系, 准教授 (70633486)
研究期間 (年度) 2015-04-01 – 2019-03-31
キーワード欠損値補間 / 異常値修正 / データクレンジング / データ結合 / 信用データ / 財務データ / 不動産データ / 公的ミクロデータ
研究実績の概要

欠損値や異常値が存在する不完全なデータに対する、データクレンジング手法については多くの研究成果がある。しかしそれらの成果は、一定の数学的仮説のもとに成り立つ方法論であり、実際のデータに対して適用可能であるとは限らない。2000年以降は、現実のデータの特性を踏まえた、特定分野を前提としたデータクレンジング手法の提案がなされている。一方、経営財務データについて統合・ビッグデータ化を行っているが、データクレンジング手法の研究は少ない。本研究では、統計学や生物・医療分野で発達した欠損値異常値処理を財務データへの適用を検討し、財務データ特有の性質を基にした新たな手法を開発する。具体的には、CRD協会データや地銀5行の財務・与信データ、政府調査のミクロデータ、不動産賃貸業データに適用する。これらの正常化されたデータベースのうち、
秘匿性の低いデータベースについては研究用に公開する。さらに昨年度から法人統計・事業所統計などの政府データと上記の企業データとの結合に関する方法論を研究し、高い精度のデータ結合を実現した。また、アルゴリズムの開発により実用的な速度でデータベース結合を可能とした。これによって企業の全数データである政府統計データと、サンプル標本ではあるが高質である信用データを基にした、企業プロファイリングが可能となった。
1.欠損値異常値に関する既存研究のサーベイ。2.医療系データベースに対して、データクレンジング手法を適用。3.経営・経済系のデータベースに対する、データクレンジング手法の適用。4.高度信用リスクデータベースの作成。5.統計モデルによる期待損失モデルの構築。6.賃貸不動産収益・リスクデー
タベースの作成。7.政府データと信用データの結合。

現在までの達成度 (段落)

平成30年度が最終年度であるため、記入しない。

今後の研究の推進方策

平成30年度が最終年度であるため、記入しない。

  • 研究成果

    (9件)

すべて 2018

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 2件) 学会発表 (5件) (うち招待講演 3件) 学会・シンポジウム開催 (1件)

  • [雑誌論文] 多項ロジットモデル及び主成分分析を用いた新たな統計的マッチング手法の提案2018

    • 著者名/発表者名
      高部勲, 山下智志
    • 雑誌名

      統計学

      巻: 115 ページ: 1-18

    • 査読あり / オープンアクセス
  • [雑誌論文] B-スプライン及びAdaptive Group LASSOに基づく正則化非線形ロジットモデルによるデフォルト確率の推定2018

    • 著者名/発表者名
      高部勲, 山下智志
    • 雑誌名

      統計数理

      巻: 66-2 ページ: 295-317

    • 査読あり / オープンアクセス
  • [雑誌論文] 多項ロジットモデルに基づく企業データの統計的マッチング(企業分析)2018

    • 著者名/発表者名
      高部勲、山下智志
    • 雑誌名

      JAFEEプロシーディングス

      巻: 2018年度夏 ページ: 1-8

    • 査読あり
  • [学会発表] AIと機械学習の直感的理解と金融への応用2018

    • 著者名/発表者名
      山下智志
    • 学会等名
      日本銀行金融機構局金融高度化センターWS
    • 招待講演
  • [学会発表] ビッグデータ時代におけるデータベース結合の目的・方法・効果2018

    • 著者名/発表者名
      山下智志
    • 学会等名
      2018年度統計関連学会連合大会
  • [学会発表] ビッグデータ時代における企業データの統計的名寄せ手法2018

    • 著者名/発表者名
      山下智志
    • 学会等名
      統計数理研究所第6回金融シンポジウム
    • 招待講演
  • [学会発表] 多項ロジットモデルに基づく企業データの統計的マッチング(理論的側面)2018

    • 著者名/発表者名
      高部勲, 山下智志
    • 学会等名
      日本分類学会第37回大会
  • [学会発表] 金融業における企業プロファイリングデータベースの作成と政府データ2018

    • 著者名/発表者名
      山下智志, 高部勲
    • 学会等名
      政府統計ミクロデータの構造化と研究利用プラットフォームの形成研究集会
    • 招待講演
  • [学会・シンポジウム開催] 第10回国際ミクロデータラボラトリーサークショップ2018

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi