研究課題/領域番号 |
22K04609
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分25010:社会システム工学関連
|
研究機関 | 金沢学院大学 |
研究代表者 |
藤本 祥二 金沢学院大学, 経済情報学部, 教授 (10756026)
|
研究分担者 |
石川 温 金沢学院大学, 経済情報学部, 教授 (90308627)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2022年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
|
キーワード | 企業財務データ / 機械学習 / レプリケート |
研究開始時の研究の概要 |
不完全性/非代表性/多ノイズ性などビッグデータ科学の問題解決のため、申請者らがこれまで培ってきた統計性の知見により内挿だけでなく外挿が可能となる企業財務データの、機械学習によるレプリケート技術を開発する。 この目的達成のため「財務ビッグデータの欠損値の統計性の調査による、データの網羅性の明確化」「欠損値補完モデルの機械学習を用いた構築による高精度化」「欠損を補完した網羅性の高いデータの統計性を確認することによる整合性の確認」「欠損値補完モデルのライブラリ、および作成したレプリカデータの公開」を段階的に行う。
|
研究実績の概要 |
本研究では、ビッグデータ科学におけるデータの不完全性、非代表性、多ノイズ性、センシティブデータの取り扱いといった問題解決を目指し、企業財務ビッグデータを用いて内挿だけでなく外挿が可能となるデータのレプリケート技術を開発している。2023年度は、ORBISデータベースの2016年版、2021年版、2024年版を結合し、より広範な企業データを整備した。これにより、欠損値の国別、業種別、年別の違いを詳細に明らかにした。次に、CatBoostアルゴリズムを用いた欠損値補完モデルの精度向上を図り、Permutation Importanceを用いて重要な説明変数を特定した。これを基に新たな補完モデルを開発し、補完後のデータの統計的整合性を確認した結果、補完モデルは高い精度と安定性を示した。さらに、研究成果を国内外の学会で発表した。また、補完モデルのライブラリとレプリカデータの一部を公開した。これにより、ビッグデータの活用における信頼性向上に貢献している。令和6年度は、ORBISの2024年版データを用い、特に新型コロナウイルスによる経済への影響が大きかった2020年から2021年の財務データの補完を行い、欠損値補完モデルの有用性を実証する予定である​​。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画に基づき、予期していた成果を上げており、次年度の研究に向けたデータ収集とモデル改善の準備も順調に進んでいる。
|
今後の研究の推進方策 |
次年度は、補完モデルのさらなる精度向上を目指し、深層学習モデルの導入を検討する。また、国や業種ごとの特異点分析を行い、モデルの適用範囲を広げる予定である。これにより、より精度の高い欠損値補完を実現し、企業財務データのレプリケート技術の実用化を進める。
|