2020 Fiscal Year Research-status Report
金融テキストマイニング-マーケットセンチメント分析と異言語文書間類似度の推定-
Project/Area Number |
18K11558
|
Research Institution | Konan University |
Principal Investigator |
関 和広 甲南大学, 知能情報学部, 准教授 (30444566)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | テキストアナリティクス / 感情分析 / ニューラルネットワーク / 経済指標 / テキスト類似度 / 多言語機械翻訳 |
Outline of Annual Research Achievements |
本研究課題は,ニュース記事等の大量のテキスト情報(テキストビッグデータ)を活用し,金融あるいは経済分野におけるテキストマイニングの研究を推進することを目的としている.より具体的には,本研究課題のサブテーマとして,速報性の高いニュースメディア等を基にしたビジネスセンチメント分析(景況感予測),および異なる言語で書かれた文書間の類似度の推定に取り組んでいる.
センチメント分析については,近年の自然言語処理タスクで主流となっているTransformerという注意機構を用いたモデルを利用することで,従来よりも頑健かつ精度の高い景況感予測が可能になった.得られた予測結果に,パラメタやモデル選択の妥当性など多面的な評価を加えた論文を和文学術論文誌に投稿し,採録が決定している.さらに,他の経済指標との定性的・定量的な比較と考察を加えた論文を現在執筆中であり,国際論文誌に投稿予定である.
異言語の文書間類似度については,2018~2019年度にすでに著名な国際学会や国際論文誌での発表を行い,ある程度の成果が得られている.しかしながら,その後,自然言語処理分野ではさらに進んだ多言語言語表現モデルの発展が著しく,これらの成果を本研究課題に取り入れるべく,調査・検討を行っている.具体的には,上でも述べたTransformerを利用した多言語モデルを利用することで,多言語で記述されたテキスト情報の有効利用や,他国の景況感指数の予測が可能になると考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通りに進んでおり,これまでの研究成果も国際会議や学術論文誌に採録されている.
|
Strategy for Future Research Activity |
2021年度は計画の最終年度であるため,これまでに開発した景況感予測モデルの分析や応用を中心に研究を発展させていく.
|
Causes of Carryover |
新型コロナウィルス感染症のため,予定していた国際会議への参加などがなくなり次年度使用額が生じた.今後の状況も不透明であるが,今年度分の助成金と合わせて学会参加やデータ取得の費用などに充て,研究推進のために有効に活用する.
|