本研究は、機械学習やテキストマイニングの手法を用いて、会計不正の発見の可能性を高めることができるかを検証することにある。近年、有価証券報告書全体のデータがXBRL形式で入手できるようになり、財務情報とナラティブ情報について、全上場企業のデータが入手可能となった。これらの全データを取得するとともに、データの前処理をおこない、分析データの蓄積・整形を進めた。また東京商工リサーチによる「不適切な会計・経理の開示企業」のデータベースを入手し、不正をおこなった企業の特徴を把握するために、同業種で同規模の企業グループとの比較を行ったが、両企業群について、大きな特徴的差異というものは観察できなかった。
|