経済シナリオ分析のための因果関係インスタンス認識技術の確立

研究課題

研究課題/領域番号	21K12010
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	北海道大学 (2023) 東京大学 (2021-2022)
研究代表者	坂地泰紀北海道大学, 情報科学研究院, 准教授 (70722809)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	3,770千円 (直接経費: 2,900千円、間接経費: 870千円) 2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	因果関係 / 因果関係インスタンス / 事前学習モデル / グラフニューラルネットワーク / テキストマイニング / 因果関係インスタンス認識 / 社会イベント分析
研究開始時の研究の概要	本研究の目的は、日本語・英語問わず、様々な金融テキストデータから、因果関係インスタンスを認識することで、社会イベント発生から個々の影響へのパスを明らかにすることである。これを達成するために、個々の因果関係インスタンスを認識する技術、抽出した因果関係インスタンスを用いて正確に因果チェーンを構築する技術の開発を行う。加えて、構築した因果チェーンを用いて国、地域、企業と異なる立場に基づくシナリオ分析可能なフレームワークを構築する。
研究成果の概要	タグ付けを行った決算短信データ、タグ付与済みの英語ロイターニュース記事、FinCausalのデータセットを用いて因果関係インスタンス抽出実験を行い、日英の文書から因果関係インスタンスを抽出できる手法の開発に取り組んだ。結果的に、BERTとグラフニューラルネットワークを組み合わせることで既存の手法よりも高い精度で因果関係インスタンスを抽出できる手法の開発に成功した。最終的に、本研究は、「FinancialCausality Extraction based on Universal Dependencies and Clue Expressions」というタイトルで査読付き論文誌に採録された。
研究成果の学術的意義や社会的意義	因果関係インスタンス抽出手法を作成するために、BERTモデルの改良の検討も行った。その結果、金融特化のBERTモデルの構築ができ、こちらをhugging faceにて公開した。また、その過程で得られた他のBERTモデルも公開し、公開したBERTモデルは幅広く利用されている。作成した因果関係インスタンス抽出手法は、日本語と英語のみならず、学習データさえ存在すれば、他の言語でも利用可能であることから、今後の研究発展が期待される。

報告書

(4件)

研究成果
(19件)

すべて 2023 2022 2021 その他

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (11件) (うち国際学会 5件) 備考 (6件)

[雑誌論文] Financial Causality Extraction Based on Universal Dependencies and Clue Expressions2023
- 著者名/発表者名
  Sakaji Hiroki、Izumi Kiyoshi
- 雑誌名
  
  New Generation Computing
  
  巻: 41 号: 4 ページ: 839-857
- DOI
  10.1007/s00354-023-00233-2
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Constructing and analyzing domain-specific language model for financial text mining2023
- 著者名/発表者名
  Masahiro Suzuki, Hiroki Sakaji, Masanori Hirano, Kiyoshi Izumi
- 雑誌名
  
  Information Processing & Management
  
  巻: 60 号: 2 ページ: 103194-103194
- DOI
  10.1016/j.ipm.2022.103194
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[学会発表] Indexing and Visualization of Climate Change Narratives Using BERT and Causal Extraction2023
- 著者名/発表者名
  Hiroki Sakaji, Noriyasu Kaneda
- 学会等名
  2023 IEEE International Conference on Big Data
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] From Base to Conversational: Japanese Instruction Dataset and Tuning Large Language Models2023
- 著者名/発表者名
  Masahiro Suzuki, Masanori Hirano, Hiroki Sakaji
- 学会等名
  2023 IEEE International Conference on Big Data
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] llm-japanese-dataset v0: Construction of Japanese Chat Dataset for Large Language Models and its Methodology2023
- 著者名/発表者名
  Masanori Hirano, Masahiro Suzuki, Hiroki Sakaji
- 学会等名
  The 12th International Workshop on Web Services and Social Media (WSSM-2023) in The 26th International Conference on Network-Based Information Systems (NBiS-2023)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Summarization of Investment Reports Using Pre-trained Model2023
- 著者名/発表者名
  Hiroki Sakaji, Ryotaro Kobayashi, Kiyoshi Izumi, Hiroyuki Mitsugi, Wataru Kuramoto
- 学会等名
  13th International Conference on Smart Computing and Artificial Intelligence (SCAI 2023) in 14th IIAI International Congress on Advanced Applied Informatics (IIAI AAI 2023)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 銘柄特徴と投資家特性を考慮した株式銘柄推薦の個別化2023
- 著者名/発表者名
  高柳剛弘, 坂地泰紀, 和泉潔
- 学会等名
  言語処理学会第29回年次大会(NLP2023)
- 関連する報告書
  2022 実施状況報告書
[学会発表] BERTとGATを用いた金融テキストにおける因果関係を含む文の判定2023
- 著者名/発表者名
  小林涼太郎, 坂地泰紀, 和泉潔
- 学会等名
  言語処理学会第29回年次大会(NLP2023)
- 関連する報告書
  2022 実施状況報告書
[学会発表] Gradual Further Pre-training Architecture for Economics/Finance Domain Adaptation of Language Model2022
- 著者名/発表者名
  Hiroki Sakaji, Masahiro Suzuki, Kiyoshi Izumi, Hiroyuki Mitsugi
- 学会等名
  2022 IEEE International Conference on Big Data (IEEE BigData 2022)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] 個別銘柄情報と銘柄間情報を利用したテーマ株抽出手法の提案2022
- 著者名/発表者名
  高柳剛弘, 坂地泰紀, 和泉潔
- 学会等名
  2022年度人工知能学会全国大会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 系列ラベリングによる原因・結果表現抽出の試み2021
- 著者名/発表者名
  坂地泰紀, 和泉潔, 加藤惇雄, 長尾慎太郎
- 学会等名
  第18回テキストアナリティクス・シンポジウム
- 関連する報告書
  2021 実施状況報告書
[学会発表] 鈴木雅弘, 坂地泰紀, 平野正徳, 和泉潔2021
- 著者名/発表者名
  金融ドメインにおける事前学習BERTモデルの性能検証
- 学会等名
  第18回テキストアナリティクス・シンポジウム
- 関連する報告書
  2021 実施状況報告書
[学会発表] 金融文書を用いた事前学習言語モデルの構築と検証2021
- 著者名/発表者名
  鈴木雅弘, 坂地泰紀, 平野正徳, 和泉潔
- 学会等名
  人工知能学会第27回金融情報学研究会
- 関連する報告書
  2021 実施状況報告書
[備考] Hiroki's page
- URL
  https://tetsuwaka.net/
- 関連する報告書
  2023 実績報告書
[備考] 事前学習言語モデル
- URL
  https://huggingface.co/izumi-lab
- 関連する報告書
  2023 実績報告書
[備考] 日本語大規模言語モデル (by SHS)
- URL
  https://llm.msuzuki.me/
- 関連する報告書
  2023 実績報告書
[備考] Hiroki's page
- URL
  https://testuwaka.net/
- 関連する報告書
  2022 実施状況報告書
[備考] 事前学習言語モデル
- URL
  https://sites.google.com/socsim.org/izumi-lab/tools/language-model
- 関連する報告書
  2022 実施状況報告書
[備考] Hiroki's page
- URL
  http://tetsuwaka.net/
- 関連する報告書
  2021 実施状況報告書

経済シナリオ分析のための因果関係インスタンス認識技術の確立

研究代表者

坂地 泰紀 北海道大学, 情報科学研究院, 准教授 (70722809)

3,770千円 (直接経費: 2,900千円、間接経費: 870千円)

報告書

研究成果

[雑誌論文] Financial Causality Extraction Based on Universal Dependencies and Clue Expressions2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Constructing and analyzing domain-specific language model for financial text mining2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Indexing and Visualization of Climate Change Narratives Using BERT and Causal Extraction2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] From Base to Conversational: Japanese Instruction Dataset and Tuning Large Language Models2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] llm-japanese-dataset v0: Construction of Japanese Chat Dataset for Large Language Models and its Methodology2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Summarization of Investment Reports Using Pre-trained Model2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 銘柄特徴と投資家特性を考慮した株式銘柄推薦の個別化2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] BERTとGATを用いた金融テキストにおける因果関係を含む文の判定2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Gradual Further Pre-training Architecture for Economics/Finance Domain Adaptation of Language Model2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 個別銘柄情報と銘柄間情報を利用したテーマ株抽出手法の提案2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 系列ラベリングによる原因・結果表現抽出の試み2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 鈴木雅弘, 坂地泰紀, 平野正徳, 和泉潔2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 金融文書を用いた事前学習言語モデルの構築と検証2021

著者名/発表者名

学会等名

関連する報告書

[備考] Hiroki's page

URL

関連する報告書

[備考] 事前学習言語モデル

URL

関連する報告書

[備考] 日本語大規模言語モデル (by SHS)

URL

関連する報告書

[備考] Hiroki's page

URL

関連する報告書

[備考] 事前学習言語モデル

URL

関連する報告書

[備考] Hiroki's page

URL

関連する報告書

坂地泰紀北海道大学, 情報科学研究院, 准教授 (70722809)