• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模企業財務データの網羅性向上に向けた機械学習によるレプリケート技術の開発

研究課題

研究課題/領域番号 22K04609
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分25010:社会システム工学関連
研究機関金沢学院大学

研究代表者

藤本 祥二  金沢学院大学, 経済情報学部, 教授 (10756026)

研究分担者 石川 温  金沢学院大学, 経済情報学部, 教授 (90308627)
研究期間 (年度) 2022-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
キーワード企業財務データ / 機械学習 / レプリケート
研究開始時の研究の概要

不完全性/非代表性/多ノイズ性などビッグデータ科学の問題解決のため、申請者らがこれまで培ってきた統計性の知見により内挿だけでなく外挿が可能となる企業財務データの、機械学習によるレプリケート技術を開発する。
この目的達成のため「財務ビッグデータの欠損値の統計性の調査による、データの網羅性の明確化」「欠損値補完モデルの機械学習を用いた構築による高精度化」「欠損を補完した網羅性の高いデータの統計性を確認することによる整合性の確認」「欠損値補完モデルのライブラリ、および作成したレプリカデータの公開」を段階的に行う。

研究実績の概要

本研究では、ビッグデータ科学におけるデータの不完全性、非代表性、多ノイズ性、センシティブデータの取り扱いといった問題解決を目指し、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発している。2023年度は、ORBISデータベースの2016年版、2021年版、2024年版を結合し、より広範な企業データを整備した。これにより、欠損値の国別、業種別、年別の違いを詳細に明らかにした。次に、CatBoostアルゴリズムを用いた欠損値補完モデルの精度向上を図り、Permutation Importanceを用いて重要な説明変数を特定した。これを基に新たな補完モデルを開発し、補完後のデータの統計的整合性を確認した結果、補完モデルは高い精度と安定性を示した。さらに、研究成果を国内外の学会で発表した。また、補完モデルのライブラリとレプリカデータの一部を公開した。これにより、ビッグデータの活用における信頼性向上に貢献している。令和6年度は、ORBISの2024年版データを用い、特に新型コロナウイルスによる経済への影響が大きかった2020年から2021年の財務データの補完を行い、欠損値補完モデルの有用性を実証する予定である​​。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究計画に基づき、予期していた成果を上げており、次年度の研究に向けたデータ収集とモデル改善の準備も順調に進んでいる。

今後の研究の推進方策

次年度は、補完モデルのさらなる精度向上を目指し、深層学習モデルの導入を検討する。また、国や業種ごとの特異点分析を行い、モデルの適用範囲を広げる予定である。これにより、より精度の高い欠損値補完を実現し、企業財務データのレプリケート技術の実用化を進める。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (13件)

すべて 2024 2023 2022

すべて 雑誌論文 (6件) (うち査読あり 6件、 オープンアクセス 2件) 学会発表 (7件) (うち国際学会 4件)

  • [雑誌論文] Statistical laws observed in earthquakes using mesh statistics: an econophysical point of view2023

    • 著者名/発表者名
      Atushi Ishikawa, Shouji Fujimoto, and Takayuki Mizuno
    • 雑誌名

      Evolutionary and Institutional Economics Review

      巻: - 号: 2 ページ: 203-216

    • DOI

      10.1007/s40844-023-00255-x

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] RoBERTa Trained from Scratch on GPS Trajectory Data2023

    • 著者名/発表者名
      Shouji Fujimoto, Atushi Ishikawa, and Takayuki Mizuno
    • 雑誌名

      2023 IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology (WI-IAT)

      巻: - ページ: 656-639

    • DOI

      10.1109/wi-iat59888.2023.00104

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Interpolation of non-random missing values in financial statements' big data using CatBoost2022

    • 著者名/発表者名
      Shouji Fujimoto, Takayuki Mizuno, and Atushi Ishikawa
    • 雑誌名

      Journal of Computational Social Science

      巻: 5 号: 2 ページ: 1281-1301

    • DOI

      10.1007/s42001-022-00165-9

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Employee Number Dependence in Labor Productivity Distribution2022

    • 著者名/発表者名
      Atushi Ishikawa, Takayuki Mizuno, and Shouji Fujimoto
    • 雑誌名

      The Review of Socionetwork Strategies

      巻: 16 号: 2 ページ: 465-477

    • DOI

      10.1007/s12626-022-00121-z

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] Copula-Based Synthetic Data Generation in Firm-Size Variables2022

    • 著者名/発表者名
      Shouji Fujimoto, Atushi Ishikawa, and Takayuki Mizuno
    • 雑誌名

      The Review of Socionetwork Strategies

      巻: 16 号: 2 ページ: 479-492

    • DOI

      10.1007/s12626-022-00128-6

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] Generation of Individual Daily Trajectories by GPT-22022

    • 著者名/発表者名
      Takayuki Mizuno, Shouji Fujimoto, and Atushi Ishikawa
    • 雑誌名

      Front. Phys.

      巻: 10 ページ: 1021176-1021176

    • DOI

      10.3389/fphy.2022.1021176

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] カープローブの大規模シンセティックデータの生成と共有2024

    • 著者名/発表者名
      水野貴之, 藤本祥二, 石川温
    • 学会等名
      情報処理学会 第86回全国大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 自己回帰型言語モデルによる個人の移動軌跡の生成2023

    • 著者名/発表者名
      水野貴之, 堀込泰三, 藤本祥二, 石川温
    • 学会等名
      2023年度 人工知能学会全国大会(第37回)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Transformer-based Model of Individual Daily Trajectories employing GPT-2 Architecture2023

    • 著者名/発表者名
      Takayuki Mizuno, Taizo Horikomi, Shouji Fujimoto, Atushi Ishikawa
    • 学会等名
      Conference on Complex Systems 2023 (CCS 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] RoBERTa Trained from Scratch on GPS Trajectory Data2023

    • 著者名/発表者名
      Shouji Fujimoto, Atushi Ishikawa, Takayuki Mizuno
    • 学会等名
      The 8th International Workshop on Application of Big Data for Computational Social Science (satellite meeting of WI-IAT 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Generation of Individual Daily Trajectories by GPT-22022

    • 著者名/発表者名
      Takayuki Mizuno , Shouji Fujimoto , Atushi Ishikawa
    • 学会等名
      2022 International Conference on Computational Social Science
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Neural probabilistic modeling of individual daily trajectories2022

    • 著者名/発表者名
      Takayuki Mizuno , Shouji Fujimoto , Atushi Ishikawa
    • 学会等名
      Migration and Mobility Research in the Digital Era (MIMODE 2022)
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] GPT-2による環境や個人属性に依存した移動軌跡の時空間情報生成2022

    • 著者名/発表者名
      水野貴之 , 掘込泰三 , 藤本祥二 , 石川温
    • 学会等名
      第2回計算社会科学会大会
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi