2018 Fiscal Year Research-status Report
金融テキストマイニング-マーケットセンチメント分析と異言語文書間類似度の推定-
Project/Area Number |
18K11558
|
Research Institution | Konan University |
Principal Investigator |
関 和広 甲南大学, 知能情報学部, 准教授 (30444566)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | テキストマイニング / データマイニング / 感情分析 / 文書類似度 / ニューラルネットワーク |
Outline of Annual Research Achievements |
本研究では,ウェブ上に存在する大量のテキスト情報を有効活用し,金融/経済テキストマイニングの研究を推進することを目的とし,2つのサブテーマについて研究を進めた.一つは,速報性の高いニュースメディア等を基にしたマーケットセンチメント分析であり,もう一つは,異なる言語で表現された文書間の類似度を推定する方法の検討である.
前者については,再帰的ニューラルネットワークを用いて初期的なセンチメント予測モデルを学習し,新聞記事でドメイン適応を行うことで,現状の景気動向を予測するモデルを作成した.このモデルで景気動向の足元予測を行ったところ,予測値と景気ウォッチャー調査D.I.の間に高い相関が見られた.これまでに得られた研究の成果は,the 2nd IEEE International Conference on Artificial Intelligence and Knowledge Engineeringにて発表予定である.
後者の類似度については,ニューラル機械翻訳モデルの中間表現に着目し,これを文の分散表現として扱うことで,他の手法と比べても高い精度で異言語文間の類似度を算出できることが確認できた.これまでに得られた研究の成果は,the 27th ACM International Conference on Information and Knowledge Management (CIKM),およびJournal of Information Processingで発表済みである.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2つのサブテーマのいずれについても当初の計画通りに進めることができており,評価実験でも想定した結果が得られている.また,これまでに得られた成果を査読付き国際会議・論文誌で発表しており,うち1件は特選論文に選ばれるなど,専門家からの評価も高い.
|
Strategy for Future Research Activity |
マーケットセンチメント分析については,予測期間を増やした上で,予測値と既存のセンチメントとの差異について詳細な比較を進める.また,分析の結果をもとに予測モデルを改善する.さらに,ソーシャルメディアの利用について検討を進める.異言語文類似度については,言語横断検索等への応用を進め,デモシステムの構築および評価実験等を行っていくことを計画している.
|
Causes of Carryover |
既存の計算機とAWSを活用することで,初年度については当初考えていたGPUサーバの導入をすることなくほぼ計画通りに研究を進めることができた.申請額に対して交付額が削減されていることもあり,計算機環境を含めた今後の使用計画については,研究の進展と研究費支出の必要性・効果を考慮しながら,使用の効果が最大化されるよう柔軟に判断していく.
|