2019 Fiscal Year Research-status Report
金融テキストマイニング-マーケットセンチメント分析と異言語文書間類似度の推定-
Project/Area Number |
18K11558
|
Research Institution | Konan University |
Principal Investigator |
関 和広 甲南大学, 知能情報学部, 准教授 (30444566)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | テキストアナリティクス / データマイニング / 感情分析 / 文書類似度 / ニューラルネットワーク / 景況感指数 / 異言語情報検索 |
Outline of Annual Research Achievements |
本研究課題では,ニュース記事等の大量のテキスト情報を活用し,金融/経済テキストマイニングの研究を推進することを目的とし,初年度に続いて2つのサブテーマについて研究を進めた.一つは,速報性の高いニュースメディア等を基にしたセンチメント分析であり,もう一つは,異なる言語で書かれた文書間の類似度の推定である.
前者については,GRUと再帰的ニューラルネットワークを用いた景況感予測モデルをベースとして,さらに予測された景況感(センチメント)を概念ごとに集計することで,どのような概念が,いつ,どれほど景気に影響を与えたか分析することを可能にした.また,所与の概念についてオンデマンドで分析を行い,分析結果を簡単に可視化できるウェブデモシステムの構築を行った.定性的・定量的な評価はこれからであるが,これまでの研究の成果は国内の学会で発表済であり,国際会議でも発表予定である.
後者の類似度については,ニューラル機械翻訳モデルの中間表現に着目した昨年度の成果を基に,さらにこれを改善した手法を提案した.具体的には,異言語空間を写像する際の直交制約の適用,翻訳モデルのnベスト解の利用,ニューラルネットワークの中間表現と翻訳モデルの出力を統合する際のランキング学習の適用などを試み,初年度の自らの研究成果および関連研究と比較して,大幅な精度向上を達成した.この研究の成果をまとめた論文は,国際論文誌Journal of Information Scienceに採録が決定している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2つのサブテーマのいずれについても当初の計画通りに進めることができており,これまでに得られた成果が査読付き国際会議・論文誌で採録されている.
|
Strategy for Future Research Activity |
景況感(センチメント)予測については,消費税増税やCOVID-19といった最近の出来事を含んだ期間のデータを加えた上で,どのような事象がどのように景況感に影響を与えているのかを詳細に分析していく.異言語文類似度で得られた成果については,今後,言語横断検索への応用や他言語テキストの景況感予測への利用に役立てていく.
|
Causes of Carryover |
コロナウイルスの影響で,3月に参加を予定していた学会がすべて中止になったため次年度使用額が生じた.これらは次年度以降の旅費に充てる予定である.
|
Research Products
(4 results)