2014 Fiscal Year Research-status Report
リアルタイム検索を基盤とした時空間テキストマイニング
Project/Area Number |
25330363
|
Research Institution | Konan University |
Principal Investigator |
関 和広 甲南大学, 知能情報学部, 准教授 (30444566)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 経済指標 / 株価 / ニューラルネットワーク / 深層学習 / マイクロブログ / 情報検索 / 情報抽出 |
Outline of Annual Research Achievements |
平成26年度は,研究計画に従い,テキスト情報の時間的特性を考慮した経済指標の予測について研究を行った.具体的には,2つの深層学習のモデルを利用した.1つ目は,リカレントニューラルネットワーク(RNN)であり,ニュースで報道された事象(イベント)などが経済変数に与える長期的な影響のモデル化を試みた.なお,より高い表現力を得るため,深層学習のモデルであるdeep belief network(DBN)の一層目に前述のRNNを用いた. 1年分の新聞記事と10企業の株価をテストデータとして用いた評価実験の結果,サポートベクタマシンと比較して7.6%の精度向上が見られた.また,リーマンショック後の約1ヶ月について見ると,RNNを用いない(すなわち時間的特性を考慮しない)DBNと比較しても,有意な精度向上(p=0.025)が見られた.
2つ目のモデルは,再帰的(recursive)ニューラルネットワークである.このモデルは,文の構文的な特徴を捉えることが可能であるという特長があり,感情分析などで有望な結果が報告されている(Socher et al., EMNLP2013).本研究では,このモデルを援用し,ニュース記事が特定の企業の株価にポジティブな効果を持つのか,ネガティブな効果を持つのかを予測するモデルを構築した.東証1部上場企業のおよそ8ヶ月分のニュース記事をテストデータとして評価実験を行ったところ,構文構造を考慮しない従来手法よりも高い予測精度が得られた.ただし,比較対象の手法によっては有意な差が見られず,今後,さらなる検討が必要である.
以上に加えて,主に25年度の成果であるマイクロブログ検索や情報抽出の研究成果について,AAAI ICWSM 2014等の国際会議や情報処理学会等の国内論文誌で発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
研究課題の2年目を終え,研究の進度は当初の予定に沿っておおむね順調に進んでいる.達成度については,付随・発展研究テーマでの成果も多く生まれ,計画以上に順調に進展している.
|
Strategy for Future Research Activity |
研究課題である時空間的なテキストマイニングを行うためには,大量のデータをリアルタイムに処理するためのフレームワークと効率的なアルゴリズムが必要になる.この点については当初の研究計画には盛り込んでおらず,26年度に予備的な研究に着手した.このサブテーマについて,27年度の研究実施の中でも継続して取り組んでいく予定である.
|
Causes of Carryover |
研究成果の公表のために論文投稿料を見込んでいたが、採録が想定よりも1~2ヶ月遅れ、請求が26年度内に生じなかったため。
|
Expenditure Plan for Carryover Budget |
論文は採録されたため、27年度に論文投稿料に充てる。
|
Research Products
(14 results)