研究課題/領域番号 |
23330108
|
研究種目 |
基盤研究(B)
|
研究機関 | 大阪市立大学 |
研究代表者 |
高田 輝子 大阪市立大学, 大学院・経営学研究科, 准教授 (30347504)
|
キーワード | 金融バブル / テキストマイニング / ネットワーク分析 / 高頻度データ |
研究概要 |
本研究の目的は、金融バブルの生成・崩壊期における投資家の期待がどのような振舞をするかについて、ウェブ上のテキストデータを用いて解析し、投資家行動や期待の時系列変動パターンや投資家間相互作用についての有益な事実を解明することである。本年度の目標は、(1)金融市場のブーム/バブルの生成・崩壊に関わるテキスト情報をウェブで自動収集するシステムを構築し、(2)解析対象であるテキストデータを収集することであった。 本年度は、多くのデータ収集対象候補の中から、最長時系列データが入手可能な以下の2つのサイトを当面の研究対象として選び出し、データの自動取得のためのPerlプログラムをほぼ完成させた。 1つめは株式投資関連英単語検索クエリ時系列データ提供サイトである。2004年~直近の時系列データが提供されており、サブプライム・バブル期を含んでいる。価格系列との時系列対応関係を観察することで、価格変動の理由づけや投資家の興味対象などの時系列推移の質的説明に有用であると思われる。米国株式市場における検索クエリ数と株価指数の時系列データについて予備的分析の結果、投資家行動についてのいくつかの新しい事実を発見した。 2つめは、株式投資関連英文掲示板サイトである。企業によっては1998年~直近のデータが入手可能であり、ITバブル期も含んでいる。書き込み数の大きいIT企業についての取得済み掲示板データを用いて、投資家間ネットワーク構造の可視化や、相互依存度の数値化のための最適な方法の開発に着手している。 情報不足下の効率的な情報抽出の為、重要変数間の相関構造をロバスト・効率的に可視化する方法も開発し、学術誌で公表した(Takada 2012)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
検索クエリ数データについては、本年度のうちに予備的解析まで行うことができた。掲示板データについては、「12.今後の研究の推進方策」で説明する理由により調査対象をIT関連企業に変更したプロジェクトとしては、おおむね予定通り進行している。データ自動取得システムも完成しており、現在は取得データの蓄積を待ちながら、取得済みデータの予備的解析や手法の開発中である。情報不足下でも有効な相関構造分析の手法の開発も済ませ、取得済みデータ解析環境も整えたため、おおむね予定通りのペースで研究が進展していると考えられる。
|
今後の研究の推進方策 |
【研究遂行上の問題点】掲示板データについて、当初はNYSEやNASDAQなどの全上場企業を対象とした株価指数と当該全上場企業について、テキストデータと株価変動の関係を分析する予定であったが、データ取得に時間がかかるため、研究期間内に米国市場全上場企業のデータを取得することは不可能であることが判明した。 【研究計画の変更】対応策として、調査対象を主要IT関連企業に限定し、時間のある限りできるだけ多くのIT関連企業めデータを取得する方針をとることにする。データ期間がITバブルもカバーしているため、主要IT関連企業に調査対象を限定しても、本研究の目的の達成は可能と思われる。主要IT企業についてのテキストデータとITバブルについての分析についても既存研究はほとんどない。なお、検索クエリ数データについては全市場対象で行う予定である。 【今後の研究推進方策】まずはITバブル生成・崩壊期における主要IT関連企業群についての掲示板情報に特徴的なパターンが発見できるか探索してみる。必要に応じて、個別企業ごとのパターン探索も検討する。その進展状況に応じて、DOW30、SP500など一部の企業で構成された株価指数も対象に加えることを視野に入れている。
|