研究課題/領域番号 |
25285127
|
研究種目 |
基盤研究(B)
|
研究機関 | 関西学院大学 |
研究代表者 |
岡田 克彦 関西学院大学, 経営戦略研究科, 教授 (90411793)
|
研究分担者 |
羽室 行信 関西学院大学, 経営戦略研究科, 准教授 (90268235)
加藤 直樹 京都大学, 工学(系)研究科(研究院), 教授 (40145826)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 行動ファイナンス / 投資家心理 / テキストマイニング / 証券価格 / アナリスト情報 / センチメント分析 / センチメント指数 / 機械学習 |
研究概要 |
本年度は、Twitter、Yahoo Financeの掲示板、ブログなどのソーシャルメディアに書き込まれた多様なテキストデータを取得し、データベースを数テラバイトまで拡張した。そして、それら大規模データを解析可能とする分散処理技術を開発し、テキストマイニング/データマイニングの技術を基盤として、市場に流れるムード、センチメントを総合的に把握するという目的を達成するための、基盤づくりに時間をさいた。大量のテキストデータを処理する基板づくりは順調にすすみ、予定通りシステムを構築することができた。こうして完成したテキストデータを含めた株式市場関連データベース(Twitter、株式投資家のブログ、株式に関する投稿掲示板、ネットニュースなど、インターネット上に公開されたテキストデータおよびBloomberg等の金融情報ベンダーが提供するニュースデータ)を利用して、以下の研究実績をあげることができた。 ① ファイナンスの教科書で長年パズルと呼ばれてきた株式市場の『季節性アノマリー』が、投資家心理の季節性と深い関係があるという点を、大量の新聞記事の中に含まれている将来予測表現が楽観に傾いているのか、悲観に傾いているのかを、言葉を定量的に測定することにより、明らかにした。これらの成果は査読付きジャーナルに掲載されたほか、英語版の論文についてはSSRNのTop ダウンロードリストに掲載されている。 ② 株価形成に投資家の注目度合いがどのように影響しているのかについて、明らかにした。株価の注目度が高い銘柄は、良いファンダメンタル情報の到来によっても、超過リターンがあまり発生しないが、注目度が低い銘柄は、より強く反応することを明らかにした。この成果についても論文にまとめ、海外査読付きジャーナルに掲載された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度は、システム開発においてはデータベース構築に必要な技術開発ならびに大規模データを高速に処理するためのシステム(並列処理の設計)を中心に研究を進めていった。またモデル開発においては、パイロット的に取得するTwitterやブログデータを対象とした市場センチメントと株価変動の関係を記述したモデルの構築を行った。具体的な事項を以下に示す。 1. 当初は、クラスタサーバーの設備:2.5GHzデュアルコアPCを50台設備し、PCクラスタ(疎結合)を構成する予定であったが、アマゾンのクラウドコンピュータで処理する方が効率的だと考え、予算をそのように使用した。2. クローリングプログラムの作成:Twitterをはじめとして、インターネット上に公開されているデータ取得のAPIを調査し、個々のサイトに応じたクローリングプログラムを作成した。3. データ収集:クローリングプログラムを実行し、日次バッチでウェブサイトを巡回しテキストデータを取得した。4. Parsingプログラムの作成:クローリングで収集した不定形フォーマットのデータを整形し、解析可能な形に変換する処理(parsing)を行った。5. データベース設計:個人投資家やブロガーなどの書き込み量は膨大であり、一般的に利用されているリレーショナルデータベースでなく、key-valueストアをベースとしたnon-SQLデータベースによるデータベースの設計を行った。また同時に分散ファイルシステムの設計も進めた。6. データベースへの格納:本研究課題終了後も継続してセンチメント指数を公開し、更新していくことによって、他の研究者が使えるようにする。そのため、4で得られたテキストデータをデータベースに格納するプログラムを作成した。
|
今後の研究の推進方策 |
平成25年度に基盤整備にある程度の目処をつけることができたため、平成26年度については、以下の項目について研究を推進していく。 1. マスメディア記事の分類:マスメディアの記事を中心に、記事の中に含まれる特徴語から分類を行う。具体的には、「業績関連」「株価水準関連」「対象企業の環境関連」「企業イベント関連」「組織関連」の5分類を考えている。それぞれのカテゴリーの中で、どのような表現が増えることが株価に影響を与えるのか、どういう表現が用いられれば株価への影響度が高いのかを探る準備作業を行う。 2. ソーシャルメディア記事の分類 Twitter, 個人投資家によるブログ、株式投資関連の投稿記事等を、1で行った同様の分類を行う。ソーシャルメディアにおける投資家心理(センチメント)の測定には、ソーシャルメディア特有の口語的感情表現が多く含まれているため、辞書を別に構築する必要がある。 3. 辞書構築・Update: ソーシャルメディアにおける投資家心理(センチメント)の吐露は、公式の新聞やインタビュー報道とは異なり、特殊な口語的感情表現が多く含まれている。このためこれまで作成してきた辞書を活用することができない。新たに、多くの絵文字表現など多種多様な表記方法に対応した辞書を構築する必要があり、この作業には手間と時間がかかることが予想される。適宜大学院生のアルバイト等を使って対応する。
|
次年度の研究費の使用計画 |
2013年に海外学会発表を予定していたが、研究の成果がまだ十分に出ていなかったため、海外学会発表を延期した。これにより予算が未消化となった。 今年度は海外学会発表の査読も通っており、発表の予定である。そのための交通費、滞在費等の支払いを、繰越分から予定している。
|