• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

自然言語処理と深層学習を用いた不正会計の発生・検知モデルに関する研究

Research Project

Project/Area Number 23K01677
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 07100:Accounting-related
Research InstitutionAoyama Gakuin University

Principal Investigator

矢澤 憲一  青山学院大学, 経営学部, 教授 (70406817)

Project Period (FY) 2023-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Keywords会計不正 / 機械学習 / 有価証券報告書 / 自然言語処理 / 深層学習 / 不正会計
Outline of Research at the Start

本研究では、近年注目を集めているテキストデータに着目し、技術的発展が目覚ましい自然言語処理技術および機械学習(深層学習)技術を用いることで不正会計の発生メカニズムを解明し、その事前検知に対する新たな知見を見出すことを目的としている。本研究の成果は、監査人、投資家、および規制当局等の利害関係者の意思決定の質を高めるとともに資本市場の信頼性の向上に資すると期待される。

Outline of Annual Research Achievements

2023年(1年目)は、教師データの作成とインプットデータの収集、前処理、特徴量の抽出という基礎的な作業を実施した。本研究では、有価証券報告書に記載されている重要な記述情報(「経営方針、経営環境及び対処すべき課題等」「経営者による財政状態、経営成績およびキャッシュ・フローの状況」「事業等のリスク」「コーポレート・ガバナンスの状況」)を主たるインプットデータとして取り上げた。分析対象としては、データの開示実務が比較的安定している2010年3月期以降から、COVID-19の影響が顕著になる前の2019年3月期までの期間を選定した。この期間のテキストデータを収集し、データの前処理と特徴量抽出を丁寧に実施した。前処理の段階では、HTMデータからテキストデータを抽出し、その後、データの前処理(クリーニングや正規化など)の作業を行った。そして、特徴量としては、文字数、文章数、単語数、トーン、可読性、固有表現などを抽出した。これらの特徴量を更に財務データや会計不正の有無を示すフラグと統合し、解析に使用するためのデータベースを作成した。なお、これら一連のステップはすべてPythonによるコードとして自動化されている。次の2024年(2年目)は、これらのデータを用いて、深層学習を含む機械学習モデルでの学習を行い、学術会議での発表準備を進める予定である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究協力者であるKPMGあずさ研究チームとの協働のもと、研究計画に沿った活動が実施できている。

Strategy for Future Research Activity

1年目は概ね研究計画通りに進んでいるため、今後も研究協力者と緊密な連携を取りながら、研究の深化に努めていく。
具体的に2024年(2年目)は教師データとインプットデータを用いて、統計解析および機械学習を実施する。ターゲットデータは不正会計の有無、インプットデータは財務変数とテキスト変数である。テキスト変数の特徴量はトーン、可読性、固有表現をそれぞれ変数化したものを使用し、さらにその他の特徴量についても検討する。
統計解析はロジスティック回帰(LR)、機械学習はK-近傍法、ロジスティック回帰、決定木、ランダムフォレスト、勾配ブースティング、深層学習はLSTM、GRU、Transformerモデルを中心に検討する。統計解析と機械学習はその解釈とパフォーマンス評価を通して精度の向上を図る。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (4 results)

All 2023

All Journal Article (4 results)

  • [Journal Article] ネコでも使える! 会計テキストマイニング(第3回・最終回)会計テキストマイニング実践編(その2)2023

    • Author(s)
      矢澤憲一
    • Journal Title

      週刊経営財務

      Volume: 3634 Pages: 29-35

    • Related Report
      2023 Research-status Report
  • [Journal Article] ネコでも使える! 会計テキストマイニング(第2回)会計テキストマイニング実践編(その1)2023

    • Author(s)
      矢澤憲一
    • Journal Title

      週刊経営財務

      Volume: 3633 Pages: 36-42

    • Related Report
      2023 Research-status Report
  • [Journal Article] ネコでも使える! 会計テキストマイニング(第1回)会計テキストマイニングの概要とプロセス2023

    • Author(s)
      矢澤憲一
    • Journal Title

      週刊経営財務

      Volume: 3632 Pages: 15-21

    • Related Report
      2023 Research-status Report
  • [Journal Article] AI時代の会計/財務分析 : 会計研究の新たなパラダイム2023

    • Author(s)
      矢澤憲一
    • Journal Title

      証券アナリストジャーナル

      Volume: 61 (9) Pages: 26-37

    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi