• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

大規模企業財務データの網羅性向上に向けた機械学習によるレプリケート技術の開発

Research Project

Project/Area Number 22K04609
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 25010:Social systems engineering-related
Research InstitutionKanazawa Gakuin University

Principal Investigator

藤本 祥二  金沢学院大学, 経済情報学部, 教授 (10756026)

Co-Investigator(Kenkyū-buntansha) 石川 温  金沢学院大学, 経済情報学部, 教授 (90308627)
Project Period (FY) 2022-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2025: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2024: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2023: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2022: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Keywords企業財務データ / 機械学習 / レプリケート
Outline of Research at the Start

不完全性/非代表性/多ノイズ性などビッグデータ科学の問題解決のため、申請者らがこれまで培ってきた統計性の知見により内挿だけでなく外挿が可能となる企業財務データの、機械学習によるレプリケート技術を開発する。
この目的達成のため「財務ビッグデータの欠損値の統計性の調査による、データの網羅性の明確化」「欠損値補完モデルの機械学習を用いた構築による高精度化」「欠損を補完した網羅性の高いデータの統計性を確認することによる整合性の確認」「欠損値補完モデルのライブラリ、および作成したレプリカデータの公開」を段階的に行う。

Outline of Annual Research Achievements

本研究では、ビッグデータ科学におけるデータの不完全性、非代表性、多ノイズ性、センシティブデータの取り扱いといった問題解決を目指し、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発している。2023年度は、ORBISデータベースの2016年版、2021年版、2024年版を結合し、より広範な企業データを整備した。これにより、欠損値の国別、業種別、年別の違いを詳細に明らかにした。次に、CatBoostアルゴリズムを用いた欠損値補完モデルの精度向上を図り、Permutation Importanceを用いて重要な説明変数を特定した。これを基に新たな補完モデルを開発し、補完後のデータの統計的整合性を確認した結果、補完モデルは高い精度と安定性を示した。さらに、研究成果を国内外の学会で発表した。また、補完モデルのライブラリとレプリカデータの一部を公開した。これにより、ビッグデータの活用における信頼性向上に貢献している。令和6年度は、ORBISの2024年版データを用い、特に新型コロナウイルスによる経済への影響が大きかった2020年から2021年の財務データの補完を行い、欠損値補完モデルの有用性を実証する予定である​​。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画に基づき、予期していた成果を上げており、次年度の研究に向けたデータ収集とモデル改善の準備も順調に進んでいる。

Strategy for Future Research Activity

次年度は、補完モデルのさらなる精度向上を目指し、深層学習モデルの導入を検討する。また、国や業種ごとの特異点分析を行い、モデルの適用範囲を広げる予定である。これにより、より精度の高い欠損値補完を実現し、企業財務データのレプリケート技術の実用化を進める。

Report

(2 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (13 results)

All 2024 2023 2022

All Journal Article (6 results) (of which Peer Reviewed: 6 results,  Open Access: 2 results) Presentation (7 results) (of which Int'l Joint Research: 4 results)

  • [Journal Article] Statistical laws observed in earthquakes using mesh statistics: an econophysical point of view2023

    • Author(s)
      Atushi Ishikawa, Shouji Fujimoto, and Takayuki Mizuno
    • Journal Title

      Evolutionary and Institutional Economics Review

      Volume: - Issue: 2 Pages: 203-216

    • DOI

      10.1007/s40844-023-00255-x

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] RoBERTa Trained from Scratch on GPS Trajectory Data2023

    • Author(s)
      Shouji Fujimoto, Atushi Ishikawa, and Takayuki Mizuno
    • Journal Title

      2023 IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology (WI-IAT)

      Volume: - Pages: 656-639

    • DOI

      10.1109/wi-iat59888.2023.00104

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Interpolation of non-random missing values in financial statements' big data using CatBoost2022

    • Author(s)
      Shouji Fujimoto, Takayuki Mizuno, and Atushi Ishikawa
    • Journal Title

      Journal of Computational Social Science

      Volume: 5 Issue: 2 Pages: 1281-1301

    • DOI

      10.1007/s42001-022-00165-9

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Employee Number Dependence in Labor Productivity Distribution2022

    • Author(s)
      Atushi Ishikawa, Takayuki Mizuno, and Shouji Fujimoto
    • Journal Title

      The Review of Socionetwork Strategies

      Volume: 16 Issue: 2 Pages: 465-477

    • DOI

      10.1007/s12626-022-00121-z

    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Journal Article] Copula-Based Synthetic Data Generation in Firm-Size Variables2022

    • Author(s)
      Shouji Fujimoto, Atushi Ishikawa, and Takayuki Mizuno
    • Journal Title

      The Review of Socionetwork Strategies

      Volume: 16 Issue: 2 Pages: 479-492

    • DOI

      10.1007/s12626-022-00128-6

    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Journal Article] Generation of Individual Daily Trajectories by GPT-22022

    • Author(s)
      Takayuki Mizuno, Shouji Fujimoto, and Atushi Ishikawa
    • Journal Title

      Front. Phys.

      Volume: 10 Pages: 1021176-1021176

    • DOI

      10.3389/fphy.2022.1021176

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] カープローブの大規模シンセティックデータの生成と共有2024

    • Author(s)
      水野貴之, 藤本祥二, 石川温
    • Organizer
      情報処理学会 第86回全国大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 自己回帰型言語モデルによる個人の移動軌跡の生成2023

    • Author(s)
      水野貴之, 堀込泰三, 藤本祥二, 石川温
    • Organizer
      2023年度 人工知能学会全国大会(第37回)
    • Related Report
      2023 Research-status Report
  • [Presentation] Transformer-based Model of Individual Daily Trajectories employing GPT-2 Architecture2023

    • Author(s)
      Takayuki Mizuno, Taizo Horikomi, Shouji Fujimoto, Atushi Ishikawa
    • Organizer
      Conference on Complex Systems 2023 (CCS 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] RoBERTa Trained from Scratch on GPS Trajectory Data2023

    • Author(s)
      Shouji Fujimoto, Atushi Ishikawa, Takayuki Mizuno
    • Organizer
      The 8th International Workshop on Application of Big Data for Computational Social Science (satellite meeting of WI-IAT 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Generation of Individual Daily Trajectories by GPT-22022

    • Author(s)
      Takayuki Mizuno , Shouji Fujimoto , Atushi Ishikawa
    • Organizer
      2022 International Conference on Computational Social Science
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Neural probabilistic modeling of individual daily trajectories2022

    • Author(s)
      Takayuki Mizuno , Shouji Fujimoto , Atushi Ishikawa
    • Organizer
      Migration and Mobility Research in the Digital Era (MIMODE 2022)
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] GPT-2による環境や個人属性に依存した移動軌跡の時空間情報生成2022

    • Author(s)
      水野貴之 , 掘込泰三 , 藤本祥二 , 石川温
    • Organizer
      第2回計算社会科学会大会
    • Related Report
      2022 Research-status Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi