2021 Fiscal Year Research-status Report
金融テキストマイニング-マーケットセンチメント分析と異言語文書間類似度の推定-
Project/Area Number |
18K11558
|
Research Institution | Konan University |
Principal Investigator |
関 和広 甲南大学, 知能情報学部, 教授 (30444566)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | センチメント分析 / 景況感指数 / 経済指標 / 時系列分析 / ナウキャスト / 足元予測 |
Outline of Annual Research Achievements |
本研究課題は,ニュース記事等の大量のテキスト情報(ビッグデータ)を活用し,金融・経済分野におけるテキストマイニングの研究を推進することを目的として実施している.そして本課題のサブテーマとして,速報性の高いニュースメディア等を基にしたビジネスセンチメント分析(景況感予測),および異なる言語で書かれた文書間の類似度の推定に取り組んできた.
前者の景況感予測については,昨年度,近年の自然言語処理タスクで主流となっている注意機構を用いたモデルを採用し,頑健かつ精度の高い景況感予測を可能とした.今年度は,このモデルによって得られた景況感を他の代表的な経済指標と定量的に比較し,本景況感指数の特徴を明らかにした.そして,この結果を論文にまとめ,著名な国際論文誌(IF=6.22)に投稿,掲載された.また,これまでの実験は過去に発行された新聞紙面の記事データを基にレトロスペクティブに行っていたのに対し,今年度は,より実用的なシステムとして,本モデルをウェブニュース記事に適用することで前日までの景況感を予測する(ほぼ)リアルタイムな景況感予測システムを開発した.この成果をまとめた論文は,2022年度に開催される国際会議に採録が決定している.
後者の異言語の文書間類似度については,本研究課題の計画前半にすでにある程度の成果が得られているところである.今年度は,その後,自然言語処理分野で新たに提案された多言語の言語表現モデルの活用を試みた.具体的には,上述の景況感予測モデルの学習に用いた日本語データから多言語モデルを学習し,英文ニュース記事から米国の景況感指数の予測が可能か予備的な検証を行った.その結果,銘柄情報などでフィルタリングした記事から得られた景況感指数は,アメリカのISM非製造業景況感指数と正の相関(r=0.68)を持つことが確認できた.今後,他言語への展開をさらに進めていく予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本来は2021年度が研究計画の最終年度であったが,コロナ禍で成果発表のための国際会議参加が2022年度にずれ込んだため研究期間を延長した.ただし,当該国際会議での発表をもって当初の研究計画はほぼ終了する予定であり,おおむね当初の計画通りに進んでいる.また,これまでの研究成果も著名な国際会議や学術論文誌に採録され,複数の論文が学会の特選論文に選出されており,当該研究分野で高く評価されている.
|
Strategy for Future Research Activity |
2022年度始めの国際会議での発表をもって当初の研究計画はほぼ終了する予定であるが,その後も前述の「研究実績の概要」で触れた多言語への展開などを進めていくことを計画している.
|
Causes of Carryover |
コロナ禍により,研究成果発表のための国際会議参加が次年度4月にずれ込んだため,旅費や参加費相当の研究費が使用できず次年度に繰り越した.しかしながら,まん延防止等重点措置が4月になっても解除されなかったため,最終的に,国際会議は日本からリモートで参加した.研究費残額については,本研究課題で提案した景況感予測モデルの多言語への展開のための経費(計算機使用料等)に利用する予定である.
|