• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

大規模企業財務データの網羅性向上に向けた機械学習によるレプリケート技術の開発

Research Project

Project/Area Number 22K04609
Research InstitutionKanazawa Gakuin University

Principal Investigator

藤本 祥二  金沢学院大学, 経済情報学部, 教授 (10756026)

Co-Investigator(Kenkyū-buntansha) 石川 温  金沢学院大学, 経済情報学部, 教授 (90308627)
Project Period (FY) 2022-04-01 – 2026-03-31
Keywords企業財務データ / 機械学習 / レプリケート
Outline of Annual Research Achievements

本研究では、ビッグデータ科学におけるデータの不完全性、非代表性、多ノイズ性、センシティブデータの取り扱いといった問題解決を目指し、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発している。2023年度は、ORBISデータベースの2016年版、2021年版、2024年版を結合し、より広範な企業データを整備した。これにより、欠損値の国別、業種別、年別の違いを詳細に明らかにした。次に、CatBoostアルゴリズムを用いた欠損値補完モデルの精度向上を図り、Permutation Importanceを用いて重要な説明変数を特定した。これを基に新たな補完モデルを開発し、補完後のデータの統計的整合性を確認した結果、補完モデルは高い精度と安定性を示した。さらに、研究成果を国内外の学会で発表した。また、補完モデルのライブラリとレプリカデータの一部を公開した。これにより、ビッグデータの活用における信頼性向上に貢献している。令和6年度は、ORBISの2024年版データを用い、特に新型コロナウイルスによる経済への影響が大きかった2020年から2021年の財務データの補完を行い、欠損値補完モデルの有用性を実証する予定である​​。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画に基づき、予期していた成果を上げており、次年度の研究に向けたデータ収集とモデル改善の準備も順調に進んでいる。

Strategy for Future Research Activity

次年度は、補完モデルのさらなる精度向上を目指し、深層学習モデルの導入を検討する。また、国や業種ごとの特異点分析を行い、モデルの適用範囲を広げる予定である。これにより、より精度の高い欠損値補完を実現し、企業財務データのレプリケート技術の実用化を進める。

  • Research Products

    (6 results)

All 2024 2023

All Journal Article (2 results) (of which Peer Reviewed: 1 results) Presentation (4 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Statistical laws observed in earthquakes using mesh statistics: an econophysical point of view2023

    • Author(s)
      Atushi Ishikawa , Shouji Fujimoto , Takayuki Mizuno
    • Journal Title

      Evolutionary and Institutional Economics Review

      Volume: - Pages: -

    • DOI

      10.1007/s40844-023-00255-x

    • Peer Reviewed
  • [Journal Article] RoBERTa Trained from Scratch on GPS Trajectory Data2023

    • Author(s)
      Shouji Fujimoto , Atushi Ishikawa , Takayuki Mizuno
    • Journal Title

      2023 IEEE International Conference on Web Intelligence and Intelligent Agent Technology (WI-IAT)

      Volume: - Pages: 656-639

    • DOI

      10.1109/wi-iat59888.2023.00104

  • [Presentation] カープローブの大規模シンセティックデータの生成と共有2024

    • Author(s)
      水野貴之, 藤本祥二, 石川温
    • Organizer
      情報処理学会 第86回全国大会
  • [Presentation] 自己回帰型言語モデルによる個人の移動軌跡の生成2023

    • Author(s)
      水野貴之, 堀込泰三, 藤本祥二, 石川温
    • Organizer
      2023年度 人工知能学会全国大会(第37回)
  • [Presentation] Transformer-based Model of Individual Daily Trajectories employing GPT-2 Architecture2023

    • Author(s)
      Takayuki Mizuno, Taizo Horikomi, Shouji Fujimoto, Atushi Ishikawa
    • Organizer
      Conference on Complex Systems 2023 (CCS 2023)
    • Int'l Joint Research
  • [Presentation] RoBERTa Trained from Scratch on GPS Trajectory Data2023

    • Author(s)
      Shouji Fujimoto, Atushi Ishikawa, Takayuki Mizuno
    • Organizer
      The 8th International Workshop on Application of Big Data for Computational Social Science (satellite meeting of WI-IAT 2023)
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi