2014 Fiscal Year Research-status Report
Project/Area Number |
25380620
|
Research Institution | Hosei University |
Principal Investigator |
坂上 学 法政大学, 経営学部, 教授 (50264792)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 冪乗分布 / 財務データ / 解析手法 / テキストマイニング |
Outline of Annual Research Achievements |
第2年度となる本年は、前年に引き続き財務データの整備をおこなった。この間、主たる財務データの入手元であるEDINETが大幅なシステム改変を実施したことにより、従来は財務データしかXBRL化されていなかったが、有価証券報告書の全体がXBRL化され、それにより非財務情報および定性情報についてもデータが入手可能となった。そこで当初は単に財務データのみを対象とした簡単なフラクタル分析をおこなう予定であったが、やや計画を変更し、非財務情報・定性情報についての分析を追加しておこなうこととした。 非財務情報・定性情報については、いわゆるテキストマイニングの手法を応用して、実際の財務データとの関係について見てみることにした。たとえば、東日本大震災以降の財務情報の変化を見てみると、「災害損失」といった項目の開示が減少していき、震災による影響が徐々に薄れていることが確認できるが、これを裏付けるために有価証券報告書における記述がどのようになっているかを、新たなXBRL形式の有価証券報告書を提出した3,783社に対し調査をおこなった。具体的には、重要語を判別するためにTF・IDF法を用いて実際の有価証券報告書において「東日本大震災」、「発電」、「原子力」といったワードがどの程度の値を示すかを計算し、比較をしてみた。それぞれ90.88、575.51、708.42という値となり、現時点においては、東日本大震災そのものの被害よりも、その後原発事故の影響による電気料金の高騰などの影響が強いという示唆を得られた。なお「東日本大震災」というワードの出現頻度を出現企業数との関係において、冪乗分布が確認されたことは興味深い結果であった。この結果は財務的な傾向とも合致しており、テキストマイニングの手法は従来の分析手法を補完する有力な方法であることを確認できた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画ではフラクタル分析やEOF分析のように財務データのみを対象とした分析を試みるだけであったが、新たにテキスト情報を中心とする非財務データが、ほぼすべての上場企業の有価証券報告書についてXBRL化されたことにより、EDINETからリアルタイムで入手可能となったという研究環境の劇的な変化があったため、計画を拡張しテキストマイニングの手法を用いた分析を追加することにした。 また分析の過程で、財務データのみならずテキストデータにおいても、特定のワードの出現頻度と出現企業数との関係において冪乗分布が確認できたことについては、新たな知見であり、新たな分析手法の一つとしてテキストマイニングの可能性を示すことができたことに大きな進展があったと思われる。
|
Strategy for Future Research Activity |
本年度は、テキストマイニングによる分析を新たに加えたため、フラクタル分析やEOF分析などについては着手しなかったが、引き続き財務データの整備を進めつつ、財務情報のみで分析できるフラクタル分析やEOF分析をまずおこなうことにする。それに平行して、非財務情報についても、データマイニング的な手法を用いて分析するとともに、とりわけテキスト情報については、テキストマイニングの手法を用いた分析を継続し、財務情報間について何らかの新たな関係を探索的に分析することにしたい。
|
Research Products
(3 results)