2015 Fiscal Year Annual Research Report
リアルタイム検索を基盤とした時空間テキストマイニング
Project/Area Number |
25330363
|
Research Institution | Konan University |
Principal Investigator |
関 和広 甲南大学, 知能情報学部, 准教授 (30444566)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | リアルタイム検索 / 株価動向予測 |
Outline of Annual Research Achievements |
マイクロブログやニュース速報など世界中で絶えず生成されるテキストストリームの中から,自分の興味・関心に適合した情報を選り分けるためには,高精度な情報検索技術が必須である.本研究では,ユーザが検索した時点での情報の価値を重視したリアルタイム検索を基盤技術として確立することを第一の目的とし,その後,時空間的なテキストマイニングに取り組んだ.具体的には,マイクロブログやニュースストリームの時間的変動と現実世界の事象(経済指標)が示す因果関係を基に,後者の予測に取り組んだ.
研究の成果として,リアルタイム検索技術については,ある話題に関連する語はその話題と類似の時間的推移をもってマイクロブログで使われることが多いという経験的知見をもとに,この特徴をユーザの検索クエリの自動拡張に利用することで,検索精度の向上を実現した.続いて,2014年度,及び2015年度(最終年度)に,マイクロブログやニュースストリーム等のリアルタイム性が高いテキスト情報を基に経済指標(株価)の予測を行った.すなわち,ニュース記事などのテキスト情報が企業の株価の短期的な動向に影響を与えると仮定し,その影響を予測するため,入力文の構文構造を反映したベクトル表現が可能な再帰的ニューラルネットワーク(RNN)による感情分析モデルを援用し,ニュース記事が配信された後の株価動向を予測した.なお,RNNモデルの学習を行うためには,構文木の各ノードに相当する単語に株価変動の動向を表すラベルを付与する必要があるため,過去の新聞記事とその配信時の株価の変動データから,自動的にラベルを付与して訓練データを生成する枠組みを提案した.関連して,米国NISTが主催する評価型ワークショップTRECのKnowledge Base Accelerationトラックにも参加し,大規模ストリームデータを対象にした情報抽出に関する研究を行った.
|
Research Products
(8 results)