• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

大規模企業財務データの網羅性向上に向けた機械学習によるレプリケート技術の開発

Research Project

Project/Area Number 22K04609
Research InstitutionKanazawa Gakuin University

Principal Investigator

藤本 祥二  金沢学院大学, 経済情報学部, 教授 (10756026)

Co-Investigator(Kenkyū-buntansha) 石川 温  金沢学院大学, 経済情報学部, 教授 (90308627)
Project Period (FY) 2022-04-01 – 2026-03-31
Keywords企業財務データ / 機械学習 / レプリケート
Outline of Annual Research Achievements

本研究ではビッグデータ科学におけるデータの不完全性(研究に必要なデータがしばしば欠けている)・非代表性(母集団からのランダムサンプルではない)・多ノイズ性(様々なノイズが含まれていてクリーニングが容易でない)・センシティブ(個人情報ななどど取り扱いが難しいデータがある)などの問題解決を図るため、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発する。
この目的を達成するために、財務ビッグデータの欠損値の統計性の調査によってデータの網羅性を明らかにし、機械学習を用いた欠損値補完モデルを構築しモデルの精度を高め、欠損を補完したデータの整合性を網羅性の高いデータの統計性で確認し、最終的には欠損値補完モデルのライブラリおよび作成したレプリカデータの公開を行う。
令和4年度は欠損値の統計性の調査するために現在保有している財務ビッグデータでるORBISの2016年版と2021年版を結合し、全企業毎に決算年に関する通年データとなるようにデータの整備を行った。そのうえで欠損値の統計性の調査を行いデータの網羅性を調査した結果、欠損値の統計性の国による違いを明らかにした。
また同時に、決定木系の回帰モデルの一つであるCatBoostアルゴリズムの機械学習を用いた欠損値補完モデルの構築を行い。さらに構築したモデルを用いて財務諸表の売上と利益に関する欠損値の補間を実行し、補完後の分布の性質を調査し、結果を学術論文として発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究成果を査読付き論文にまとめており、当初の研究計画通りに進展している。

Strategy for Future Research Activity

モデルの寄与率を上げる重要な説明変数の特定し、モデルの精度を高めるとともに主要説明変数のみを用いた欠損値補完モデルを開発する。

Causes of Carryover

次年度以降に必要な外国旅費と研究に必要なデータの購入費に回したため。

  • Research Products

    (7 results)

All 2022

All Journal Article (4 results) (of which Peer Reviewed: 4 results,  Open Access: 2 results) Presentation (3 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Interpolation of non-random missing values in financial statements’ big data using CatBoost2022

    • Author(s)
      Fujimoto Shouji、Mizuno Takayuki、Ishikawa Atushi
    • Journal Title

      Journal of Computational Social Science

      Volume: 5 Pages: 1281~1301

    • DOI

      10.1007/s42001-022-00165-9

    • Peer Reviewed / Open Access
  • [Journal Article] Employee Number Dependence in Labor Productivity Distribution2022

    • Author(s)
      Ishikawa Atushi、Mizuno Takayuki、Fujimoto Shouji
    • Journal Title

      The Review of Socionetwork Strategies

      Volume: 16 Pages: 465~477

    • DOI

      10.1007/s12626-022-00121-z

    • Peer Reviewed
  • [Journal Article] Copula-Based Synthetic Data Generation in Firm-Size Variables2022

    • Author(s)
      Fujimoto Shouji、Ishikawa Atushi、Mizuno Takayuki
    • Journal Title

      The Review of Socionetwork Strategies

      Volume: 16 Pages: 479~492

    • DOI

      10.1007/s12626-022-00128-6

    • Peer Reviewed
  • [Journal Article] Generation of individual daily trajectories by GPT-22022

    • Author(s)
      Mizuno Takayuki、Fujimoto Shouji、Ishikawa Atushi
    • Journal Title

      Frontiers in Physics

      Volume: 10 Pages: 1021176.

    • DOI

      10.3389/fphy.2022.1021176

    • Peer Reviewed / Open Access
  • [Presentation] Generation of Individual Daily Trajectories by GPT-22022

    • Author(s)
      Takayuki Mizuno , Shouji Fujimoto , Atushi Ishikawa
    • Organizer
      2022 International Conference on Computational Social Science
    • Int'l Joint Research
  • [Presentation] Neural probabilistic modeling of individual daily trajectories2022

    • Author(s)
      Takayuki Mizuno , Shouji Fujimoto , Atushi Ishikawa
    • Organizer
      Migration and Mobility Research in the Digital Era (MIMODE 2022)
    • Int'l Joint Research
  • [Presentation] GPT-2による環境や個人属性に依存した移動軌跡の時空間情報生成2022

    • Author(s)
      水野貴之 , 掘込泰三 , 藤本祥二 , 石川温
    • Organizer
      第2回計算社会科学会大会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi