• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

Financial fraud detection using machine learning

Research Project

Project/Area Number 18K01923
Research InstitutionHosei University

Principal Investigator

坂上 学  法政大学, 経営学部, 教授 (50264792)

Project Period (FY) 2018-04-01 – 2023-03-31
Keywords会計不正 / 機械学習 / ディープラーニング / テキストマイニング / XBRL
Outline of Annual Research Achievements

本研究の第2年度は、初年度に続き不正会計研究に関する研究動向についての調査をおこなった。これについては論文にまとめ、「機械学習による会計不正発見の研究動向」(橋本尚編著、『現代会計の基礎と展開』第15章所収、同文舘出版、2019年)として公表することができた。その後、新たに宇宿・近藤・白木・菅・宮川(2019)の研究も公表されたりしており、今後、会計不正に対する機械学習の応用研究は確実に増えてくることは確実であるが、現時点ではまだ少ないのが実情である。
文献レビューに加え、実際に監査業務においてAIなどの新しい技術を応用しているトーマツの外賀友明氏と、会計パッケージを開発販売している弥生会計の岡本浩一郎氏と、神戸大学でのワークショップで一緒に登壇する機会に恵まれ、実務における最新の動向について研究打合せをする機会が得られた。この中で、機械学習の応用の難しさや過学習の問題などについて、現実の問題を伺い知ることができたことは大きな成果であった。
分析のためデータ収集も引き続きおこない、2013年度より稼働を始めた次世代EDINETシステムより入手できる有価証券報告書の全文データは、第2年度末までに7年度分のデータを蓄積することができた。
以上に加え、初年度に実施することのできなかった解析用のコンピュータ・システムの導入を行ない、研究環境の整備に努めた。具体的には、テキストマイニング用の形態素解析器および、機械学習のためのディープラーニング・フレームワークのインストールと動作確認である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度に導入予定であったコンピュータシステムの導入が遅れていたが、仮想通貨の暴落を受けて多くのマイニングファームが破綻したため、第2年度始めには必要となる機器(CUDAコアを大量に搭載したGPU)の価格が落ち着いたこともあり、当初の予算内での入手が可能となった。
このため、直ちにコンピュータシステムの導入と、研究環境の整備をおこなった。具体的には、OSのインストールおよび必要となるソフトウェア、たとえばPerl、Python等のスクリプト言語、TensorFlowやChainerといったディープラーニング・フレームワーク、MeCabやJUMAN++といった日本語形態素解析器、統計ソフトウェアのRとRから形態素解析器MeCabを利用するためのRMeCabといったソフトウェア環境の導入と動作確認等を済ませた。
更に、昨年度よりおこなっていた機械学習による会計不正発見の研究動向についてのレビューをまとめたものを論文として公表することができた。分析データの収集も順調に進んでおり、初年度の遅れを取り戻し、当初の研究計画の進捗状況に追いついたといえる。

Strategy for Future Research Activity

研究環境の整備とデータの収集が順調に進んでいるので、本格的な分析を始めることにする。
第3年度は、過去の有価証券報告書よりテキストデータを抽出し、テキストマイニングを試みることにしたい。テキストマイニングをおこなうにあたっては、その前処理として形態素解析を行わなければならないが、本研究では形態素解析器の解析結果の比較も行うことを計画している。具体的には、MeCabとJUMAN++という2つの形態素解析器を使い、実際の有価証券報告書のデータを解析した結果を比較し、同時に、使用する辞書についても変えることにより、解析結果がどのように変わるかについても調べることにする。有価証券報告書のテキストデータは、多くの会計専門用語が用いられており、実際の解析結果を見て、どちらの形態素解析器がより適しているのかについて検討を行なう予定である。
形態素解析器の比較を終えたら、続いて有価証券報告書のテキストデータより、重要語の抽出を試みることにしたい。具体的には重要語抽出の基本アルゴリズムとして知られるTF/IDFと、近年注目を集めているOkapi BM25の2つを用いる予定である。両者の精度や傾向などを把握したうえで、会計不正にかかわる用語がどのように抽出されるかを、2013年度以降にEDINETを通じて入手したXBRLデータを使って検証する。

Causes of Carryover

3月27日(金)に神戸商科大学で開催予定の研究会が、新型コロナウイルスの影響で中止となってしまい、旅費の執行ができなかったため、次年度使用額が生じてしまった。
現時点で、中止となった当該研究会の再度の開催は予定されておらず、また他の学会や研究会も対面形式の会合は、新型コロナウイルスの影響でことごとく中止ないしは延期となってしまっている。その一方で、多くの学会・研究会が、Zoom 等の Web 会議システムによる開催方式へと切り替わることになっている。このような状況変化に対応するため、使用計画としては、Web会議システムに必要な、Webカメラや機器接続のためのアダプター等の購入に充てることにしたい。

  • Research Products

    (6 results)

All 2020 2019

All Journal Article (2 results) (of which Open Access: 1 results) Presentation (2 results) Book (2 results)

  • [Journal Article] 実験会計研究の未来2020

    • Author(s)
      坂上 学、田口 聡志、上枝 正幸、廣瀬 喜貴
    • Journal Title

      イノベーション・マネジメント

      Volume: 17 Pages: 21~37

    • DOI

      https://doi.org/10.24677/riim.17.0_21

    • Open Access
  • [Journal Article] ITやフィンテックが税務会計研究に与える影響2019

    • Author(s)
      坂上 学
    • Journal Title

      税務会計研究

      Volume: 30 Pages: 57-72

  • [Presentation] 統一論題解題2019

    • Author(s)
      坂上 学
    • Organizer
      日本簿記学会第35回全国大会(8月24日、中央大学)
  • [Presentation] ワークショップ解題2019

    • Author(s)
      坂上 学
    • Organizer
      神戸大学RIAM第101回ワークショップ(9月29日、神戸大学)
  • [Book] 会計学と租税法の現状と課題2019

    • Author(s)
      菊谷 正人
    • Total Pages
      504
    • Publisher
      税務経理協会
    • ISBN
      978-4419066116
  • [Book] 現代会計の基礎と展開2019

    • Author(s)
      橋本尚
    • Total Pages
      524
    • Publisher
      同文舘出版(株)
    • ISBN
      978-4495209810

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi