2018 Fiscal Year Research-status Report
テキスト分析による有価証券報告書の文章情報の情報価値の分析
Project/Area Number |
18K18566
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
井上 光太郎 東京工業大学, 工学院, 教授 (90381904)
|
Co-Investigator(Kenkyū-buntansha) |
中田 和秀 東京工業大学, 工学院, 准教授 (00312984)
池田 直史 東京工業大学, 工学院, 助教 (90725243)
|
Project Period (FY) |
2018-06-29 – 2021-03-31
|
Keywords | テキストマイニング / 有価証券報告書 / ファイナンス |
Outline of Annual Research Achievements |
本年度は、最初に有価証券報告書のテキストデータを分析可能なフォーマットにするための変更作業を進め、その上でいくつかの分析を開始した。第1に任意の2つの企業の有価証券報告書の記載内容の類似性が、企業間のM&A実施とその経済効果に与える影響を分析した。第2に有価証券報告書に記載された個別企業の戦略やリスク認識などが、当該企業の株式のリスクプレミアムに与える影響の検証を進めた。第3に有価証券報告書の記載内容の特徴量を計測し、それらがどのような経済的意味を持つかの分析を進めている。 第1の研究については、有価証券報告書に記載された事業内容、研究開発動向の企業間の類似性が将来のM&Aの発生確率に強い正の効果を持つこと、またその類似性がM&Aのプレスリリースに記載されたM&Aの目的等の記述と強い正の相関を持つことを確認した。これらの結果は企業行動の予測に関して、有価証券報告書のテキスト情報が定量情報にない独自の情報価値を持つことを示す。この論文について、2つの学会での報告を経て、現在は国内査読付き学会誌に投稿中である。 第2の研究については、有価証券報告書の「事業等のリスク」の記載内容が、その企業の1期先の株式市場におけるリスクプレミアムを予測するかについての検証を行っている。分析結果として、有価証券報告書に記載されたリスク情報が、翌期の株価に反映される当該企業のリスクに対し説明力を持つこと示した。本研究について、2つの学会での報告を経て、現在、追加の分析を行っている。 第3の研究については、有価証券報告書の記載内容に対し、LDA(Latent Dirichret Allocation)と階層的LDAを用いて特徴量を抽出し、結果として階層的LDAでは産業の特徴を捉えたトピックを抽出できていることが確認できた。現在は、階層的LDAで抽出した特徴量の持つ意味を評価するために,将来の利益率の予測可能性などを分析中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究については、研究実績の概要に記載した通り、大きく分けて3つのプロジェクトを推進している。 まず、基本となる有価証券報告書のテキストデータに関しては、テキスト分析可能な状態に仕上げ、また第2の企業のリスクに関するテキストデータに関しては、米国における先行研究などを参考に、独自に日本語の辞書の作成を行った。 また、第1の任意の2つの企業の有価証券報告書の記載内容の類似性が、企業間のM&A実施とその経済効果に与える影響の分析についてはこれまでのところ順調に推移し、2つの学会で報告を経て、国内査読付き学会誌に投稿中である。 第2の有価証券報告書に記載された個別企業の戦略やリスク認識などが、当該企業の株式のリスクプレミアムに与える影響の検証について、当初計画していた作業により一定の結果は得て国内学会での報告を行ったが、そこでの指摘を踏まえ、さらなる拡張の必要性を認識し、分析範囲、手法の拡張を行っている。 第3の有価証券報告書の記載内容の特徴量を計測し、それらがどのような経済的意味を持つかの分析については、当初想定していたような明確な結果を得るには至っておらず、さらに新たな分析手法を今後試行することを計画している。この分析は、海外での先行研究も乏しく、探索的なアプローチとなるため、引き続き様々な手法を試行する予定である。
|
Strategy for Future Research Activity |
今後の計画については、第1の任意の2社間の有価証券報告書の記載内容の類似性が、M&Aの発生やその経済性に与える影響の研究については、現在の投稿先専門誌からのリプライ内容を検討し、早期に査読誌への掲載可能となるように修正し、完成を急ぐ。 第2の有価証券報告書の事業等のリスクの記載内容が、その企業の株式のリスクプレミアムを予測するかの研究についても、学会等で分析期間の拡張を求められており、この指摘への対応を行う。さらに分析項目や期間を拡張し、結果の頑健性を検証し、さらに経済学的な解釈を行うことで、さらに分析結果の示唆の明確化を進める。 第3の有価証券報告書のテキストのトピックモデルを使用した分析、および階層的LDAを用いた分析については、さらに抽出したトピックと業績や企業行動の関係性についての検証を進める。こうした高度なテキストマイニング手法を利用した分析は有価証券報告書に対してはまだ日本では行われておらず、新たな知見を得られるものと期待できる。また、LDA及び階層的LDA以外の手法を用いることにより,よりよい特徴量を抽出できる可能性がある.そのため、テキストマイニングでしばしば利用されている他の分析手法を用いて特徴量の抽出を行い、定量的な評価を行う。また、有価証券報告書に加え、企業の属性情報,財務情報など企業の変化を捉えた数値データなどと組み合わせて分析を行うことによって精度の向上を目指す。 上記に加えて、研究の拡張として有価証券報告書の「研究開発活動」のテキストデータを活用し、企業のイノベーションとの関係の検証準備を進めている。これまで有価証券報告書の研究開発活動に関する記載が、研究活活動の成果をどの程度反映しているかに関する分析はこれまでない。研究開発の成果は定量的財務数値では計測の困難なため、新たな知見の提示につながることを期待できる。
|
Causes of Carryover |
挑戦的研究(萌芽)の内定時期が6月末であることを知らず、昨年4月時点に非採択であったと誤認し、本年度計画していた研究について所属先大学から配分される研究財源を充当して、研究遂行に必要な支出を先行して進めていたため、当初の本年度申請分を全額使用するに至らなかったことが、次年度使用額が発生した主な原因である。 一方で、本年度の研究により、当初計画よりも分析対象の拡張が必要なこと、テキストデータ以外の企業情報データの取得も分析上必要なことが判明したことから、今後においては当初計画以上の研究予算が必要となることが見込まれ、次年度使用額を消化することが見込まれる。
|
Research Products
(4 results)