2019 Fiscal Year Research-status Report
テキスト分析による有価証券報告書の文章情報の情報価値の分析
Project/Area Number |
18K18566
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
井上 光太郎 東京工業大学, 工学院, 教授 (90381904)
|
Co-Investigator(Kenkyū-buntansha) |
中田 和秀 東京工業大学, 工学院, 准教授 (00312984)
池田 直史 東京工業大学, 工学院, 助教 (90725243)
|
Project Period (FY) |
2018-06-29 – 2021-03-31
|
Keywords | テキストマイニング / 有価証券報告書 / ファイナンス / Word Embedding |
Outline of Annual Research Achievements |
本年度は、2つの研究プロジェクトで学会発表および学術誌掲載を目指す段階に達した。第1の研究プロジェクトとして、有価証券報告書に記載された事業内容、研究開発動向の企業間の類似性が将来のM&Aの発生を予測するかの検証論文を完成させた。分析結果として有価証券報告書に記載された事業内容、研究開発動向の企業間の類似性が将来のM&Aの発生確率に強い正の効果を持つこと、またその類似性がM&Aのプレスリリースに記載されたM&Aの目的等の記述と強い正の相関を持つことを確認した。これらの結果は企業行動の予測に関して、有価証券報告書のテキスト情報が定量情報にない独自の情報価値を持つことを示す。この論文について前年度の2つの学会での報告を経て、ファイナンス分野の有力な査読付き学会誌に投稿し、その査読者からの要求に対応した修正を行った上で再投稿し、現在結果待ちである。 第2の研究プロジェクトとして、有価証券報告書の「事業等のリスク」の記載内容が、その企業の1期先の株式市場におけるリスクプレミアムを予測するかについての検証を行っている。本年度は、機械学習手法であるWord Embeddingを用いて新たな辞書を再作成して分析を大幅に発展させ、有価証券報告書に記載されたリスク情報が翌期の株価に反映される当該企業のリスクに対し説明力を持つこと示した。一方で、事前期間の株価情報から推定されるリスクに対して、テキスト情報が追加的な説明力を持つかの検証結果では、追加情報を持つとは言えないとの結果を得た。これは、日本の有価証券報告書が企業のリスクに関する有用な情報を持つが、毎年の変化が乏しく、株式市場に織り込まれた以上の新規情報を提供していないことを示唆する。本研究については、前年度に学会報告を行っており、本年度に最終論文を完成させ、すでに査読付き学術誌に投稿を行い、現在査読結果待ちである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
第1の研究プロジェクトの任意の2社間の有価証券報告書の記載内容の類似性が、M&Aの発生やその経済性に与える影響の研究については、学術誌の査読で得た指摘への対応を終え再投稿を行い、再査読の結果待ちである。 第2の研究プロジェクトの有価証券報告書の事業等のリスクの記載内容が、その企業の株式のリスクプレミアムを予測するかの研究についても、分析手法や対象の拡張を通して結果の頑健性を確認し、査読付き学術誌に投稿し結果待ちである。この点で本研究計画は概ね順調に進展している。 一方で第2の研究プロジェクトの発展と位置づけられる第3の研究プロジェクトである有価証券報告書のテキストのトピックモデルを使用した分析、および階層的LDAを用いた分析については初期の分析において期待通りの結果が得られず、手法の改善の試行錯誤に時間を要したこと、上記2つの研究プロジェクトの完成を優先した結果、当初予定よりやや進捗が遅れている。しかし、毎年更新されるテキストデータを追加することでサンプル数を増大させ、また2020年3月期から有価証券報告書の定性情報の充実化が金融庁、証券取引所から要請されていることに注目して、その記載内容の変化に注目した分析を開始した。本研究で使用する高度なテキストマイニング手法を利用した分析は有価証券報告書に対してはまだ日本では行われておらず、新たな知見を得られるものと期待できる。 全体として、現時点で申請時の計画とほぼ一致したスケジュールで進行しており、来年度が計画最終年度に当たることから、特に第3の研究プロジェクトを推進し、研究の拡張を試みながら、ファイナンス研究における定性情報のテキスト分析の有用性の検証という本研究の目標に到達することは十分に可能であると考えている。
|
Strategy for Future Research Activity |
上記の現在までの進捗状況に記載した内容のうち、第1と第2の研究プロジェクトについては学術誌掲載に向けた改善作業を継続する。 第3の有価証券報告書のテキストのトピックモデルを使用した分析、および階層的LDAを用いた分析については、金融庁が2020年3月期から要請している記述内容の充実化を外生的イベントして、その記述内容の変化によりテキスト情報と業績や企業行動の関係性に変化が生じているかの検証を進める。このような企業の開示情報に外生的な要因での変化が生じる機会は因果推論を行う上で有用であり、この機会を最大限活用する。また、階層的LDAなど高度なテキストマイニング手法を利用した分析は有価証券報告書に対してはまだ日本では行われておらず、新たな知見を得られるものと期待できる。 さらに金融庁、証券取引保、経済産業省などは事業セグメント情報の開示の充実も求めており、有価証券報告書のセグメント情報の開示水準と多角化企業への株式市場の評価という視点からの分析に拡張する方向に方針を定め、すでに本年度中にデータの取得を進めるなど、その準備を進めている。 今後は、有価証券報告書の記載内容の充実の要請など外生的ショックを利用した企業によるテキストの開示水準と企業価値の因果関係の推定を行うためのモデルを精緻化し、同一企業における時系列でのテキストの変化に注目した分析を進める計画である。
|
Causes of Carryover |
本計画内において先行した2研究の学術誌投稿に向けた作業を優先したため、特に研究費用を要する第3の研究プロジェクト(第2の研究プロジェクトの発展に相当する)にやや遅れが生じたこと、令和2年3月に本分野で先行しているチューリッヒ大学での報告のための出張予定がコロナ問題で延期になったことなどにより次年度使用額が生じた。 すでに先行する2研究のうち1本の再投稿、もう一本の初回投稿が終わっており、計画最終年度の本年度は第3の研究プロジェクト(金融庁の有価証券報告書記載事項の実質化の要請の効果検証)を推進する。その分析に必要な令和2年3月期決算の有価証券報告書データの購入(セグメント情報も追加するため、例年より増額し55万円)および企業財務データ購入(大学研究費と合算で支出予定:55万円)、コロナ問題で延期した海外出張(スイス)の旅費(30万円)、機械学習用のPCおよびソフト購入費(70万円)、テキストデータ整理などを補助する研究補佐スタッフ給与(年間計70万円)などの支出計画を立てており(合計280万円)、次年度使用額と令和3年度の予算額を合算して上記の必要な予算額をカバーし、不足分は大学研究費を充当して本研究計画の目標を到達する計画である。
|
Remarks |
井上研究室HP上に「有価証券報告書のテキストマイニングによる株式のリスクファクター分析」データ公開 を開設し、独自に開発した有価証券報告書分析に用いたリスク用語辞書を公開。
|
Research Products
(1 results)