2020 Fiscal Year Research-status Report
テキスト分析による有価証券報告書の文章情報の情報価値の分析
Project/Area Number |
18K18566
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
井上 光太郎 東京工業大学, 工学院, 教授 (90381904)
|
Co-Investigator(Kenkyū-buntansha) |
中田 和秀 東京工業大学, 工学院, 教授 (00312984)
池田 直史 日本大学, 法学部, 准教授 (90725243)
|
Project Period (FY) |
2018-06-29 – 2022-03-31
|
Keywords | テキストマイニング / 有価証券報告書 / ファイナンス / Word Embedding |
Outline of Annual Research Achievements |
本年度は、第1に先行して進めてきた2つの研究プロジェクトで論文を査読学術誌に投稿し、査読者のコメントに対応する作業を行った。第1の研究プロジェクトとして、有価証券報告書に記載された事業内容、研究開発動向の企業間の類似性が将来のM&Aの発生を予測するかの検証論文については『金融経済研究』に掲載が決定した。分析結果として有価証券報告書に記載された事業内容、研究開発動向の企業間の類似性が将来のM&Aの発生確率に強い正の効果を持つこと、業種の異なる2社間の多角化M&Aにおいて類似性が正の効果を持ち、範囲の経済性への期待がM&Aの背景にあることを示した。 第2の研究プロジェクトとして、有価証券報告書の「事業等のリスク」の記載内容が、その企業の1期先の株式市場におけるリスクプレミアムを予測するかについての検証論文は、『証券アナリスジャーナル』に掲載した。機械学習手法であるWord Embeddingを用いて株式リスクに関する新たな辞書を作成し、有価証券報告書に記載されたリスク情報が翌期の株価に反映される当該企業のリスクに対し説明力を持つことを示した。一方で有価証券報告書が企業のリスクに関する記述の毎年の変化が乏しく、株式市場に織り込まれた以上の新規情報を提供していないことを示した。 第3に、内閣府令による有価証券報告書の記述内容の充実の要請による2020年3月期からの有価証券報告者の記載内容の変化が、企業と投資家の間の情報非対称性を緩和し、株価形成に好ましい影響を持つとの仮説を立て、検証を進めている。この研究については、令和3年の秋の学会の報告を計画して分析を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究実績の概要に記述した通り、先行する2つの研究についてはすでに査読付き学術誌に掲載、または掲載決定しており順調に進んだ。 一方で、先行する2つの研究と一緒に進めてきた有価証券報告書のテキストに対するトピックモデルを使用した分析、および階層的LDAを用いた分析については手法の改善を進めその成果は第26回人工知能学会・金融情報学研究会で発表し、さらに分析を拡張した結果を2021年度に国際学会で報告が決まっている。 第3の研究プロジェクトである2020年3月期から有価証券報告書の定性情報の充実化が金融庁、証券取引所から要請されていることに注目して、その記載内容の変化に注目した分析についてはコロナの影響等でリモートワークが要請されたことで大学研究施設の使用が制限されたこと、分析に必要なデータの公開時期が遅れたことなどの影響を受けやや遅れている。このため、1年間の研究期間延長を行い、分析を急いでいる。2021年度中の学会報告、投稿論文の完成を目指している。
|
Strategy for Future Research Activity |
第1、第2の研究プロジェクトは成果論文の学術誌への公刊をもって一段落しており、今後は第3の研究プロジェクトに注力する。金融庁が2020年3月期から要請している記述内容の充実化を外生的イベントして、その記述内容の変化の違いにより、株価形成に異なる影響を与えるか関する検証を進める。このような企業の開示情報に外生的な要因での変化が生じる機会は因果推論を行う上で有用であり、この機会を有価証券報告書の定性情報の持つ情報効果を推定するために最大限活用する。特に階層的LDAなど高度なテキストマイニング手法を利用した分析は有価証券報告書に対してはまだ日本では行われておらず、新たな知見を得られるものと期待できる。 また、機械学習手法を用いた分析については、2021年度にIEEE 8th International Conference on Industrial Engineering and Applications (ICIEA 2021)での報告が決定している。
|
Causes of Carryover |
コロナ禍により購入予定のデータの提供時期が遅れたこと、リモートワークが要請され大学の研究設備が使用できない期間が生じ、研究に遅れが生じたことによる。次年度使用額は第3の研究の分析を精緻化するため、2021年3月期の有価証券報告書のテキストデータなどの購入とそのデータ整理のためのリサーチアシスタント経費で全額支出予定である。
|
Remarks |
佐藤隆清、池田直史、井上光太郎(2021)証券アナリストジャーナル59(1)の論文で作成したリスク用語辞書データを公開している。
|
Research Products
(4 results)