イベント間関係知識の推論過程を考慮した常識推論モデルの構築

研究課題

研究課題/領域番号	22KJ1921
補助金の研究課題番号	22J15958 (2022)
研究種目	特別研究員奨励費
配分区分	基金 (2023) 補助金 (2022)
応募区分	国内
審査区分	小区分61030:知能情報学関連
研究機関	京都大学
研究代表者	大村和正京都大学, 情報学研究科, 特別研究員(DC2)
研究期間 (年度)	2023-03-08 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	1,700千円 (直接経費: 1,700千円) 2023年度: 800千円 (直接経費: 800千円) 2022年度: 900千円 (直接経費: 900千円)
キーワード	自然言語処理 / 常識推論 / 自然言語理解 / 談話関係認識 / 蓋然的関係 / 談話関係解析
研究開始時の研究の概要	深層学習の発展に伴い、計算機の言語処理能力は長足の進歩を遂げているが、計算機による常識推論は未だ困難であることが報告されている。本研究では、常識推論の中でも基本的な事態間の蓋然的関係(ある程度続けて起こりうる事態間の関係)を推論する能力に焦点を当て、この改善に取り組む。まず、大規模テキストから自動獲得される蓋然的関係知識を用いた学習手法を検討し、知識を広範に学習したモデルを構築する。続いて、テキストに表出することが少ない推論過程の情報を付与することで、より深い言語理解を問うデータを構築し、高度な常識推論を行うモデルの構築を目指す。
研究実績の概要	談話関係とは文間・節間の意味的な関係を指す．中でも「お腹が空いたので，ご飯を食べる」といった，一方が他方を引き起こし得る事態間に成立する談話関係を蓋然的関係と呼ぶ．本研究では，基本的な蓋然的関係を推論する能力（常識推論能力と呼ぶ）に焦点を当て，常識推論能力及び更なる言語能力をデータ駆動で改善する手法の開発に取り組んだ．前年度までは，常識推論能力を評価するためのデータセットの構築，並びに自動生成データによる常識推論及び関連タスクへの効果の検証に取り組んだ．本年度はこれらの取り組みをまとめて論文化し，会誌「自然言語処理」への採録を進めた．この結果，論文は昨年9月に採録が決定し，2023年度の言語処理学会論文賞を受賞した．また，当初の研究計画では基本的な蓋然的関係の推論過程を問う言語資源の構築を本年度の目標としていたが，近年登場したChatGPTをはじめとする大規模言語モデルに対して予備実験を行った結果，大規模言語モデルは概ね妥当な推論過程を生成できる傾向が確認された．そのため，本年度はこの方針ではなく研究の対象を蓋然的関係から談話関係全体に拡張し，談話関係を推論する能力の改善手法の開発に取り組んだ．具体的には，大規模言語モデルを用いた合成データの生成手法を開発し，合成データが談話関係認識の改善に有効であることを実証した．この成果をまとめた論文は今年3月に自然言語処理の主要国際会議LREC-COLINGに採択され，5月に発表を行う予定である．

報告書

(2件)

2023 実績報告書
2022 実績報告書

研究成果
(6件)

すべて 2024 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (5件) (うち国際学会 3件)

[雑誌論文] 基本イベントに基づく常識推論データセットの構築と利用2023
- 著者名/発表者名
  大村和正、河原大輔、黒橋禎夫
- 雑誌名
  
  自然言語処理
  
  巻: 30 号: 4 ページ: 1206-1239
- DOI
  10.5715/jnlp.30.1206
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[学会発表] An Empirical Study of Synthetic Data Generation for Implicit Discourse Relation Recognition2024
- 著者名/発表者名
  Kazumasa Omura, Fei Cheng, Sadao Kurohashi
- 学会等名
  The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Toward Game-Based Learning of Japanese Writing for Elementary School Students2023
- 著者名/発表者名
  Kazumasa Omura, Kei Kubo, Frederic Bergeron, Sadao Kurohashi
- 学会等名
  The 31st International Conference on Computers in Education (ICCE 2023)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] テキスト生成モデルによる日本語形態素解析2023
- 著者名/発表者名
  児玉貴志, 植田暢大, 大村和正, 清丸寛一, 村脇有吾, 河原大輔, 黒橋禎夫
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] Improving Commonsense Contingent Reasoning by Pseudo-data and its Application to the Related Tasks2022
- 著者名/発表者名
  Kazumasa Omura, Sadao Kurohashi
- 学会等名
  The 29th International Conference on Computational Linguistics
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] KWJA: 汎用言語モデルに基づく日本語解析器2022
- 著者名/発表者名
  植田暢大, 大村和正, 児玉貴志, 清丸寛一, 村脇有吾, 河原大輔, 黒橋禎夫
- 学会等名
  情報処理学会第253回自然言語処理研究会
- 関連する報告書
  2022 実績報告書

イベント間関係知識の推論過程を考慮した常識推論モデルの構築

研究代表者

大村 和正 京都大学, 情報学研究科, 特別研究員(DC2)

1,700千円 (直接経費: 1,700千円)

報告書

研究成果

[雑誌論文] 基本イベントに基づく常識推論データセットの構築と利用2023

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[学会発表] An Empirical Study of Synthetic Data Generation for Implicit Discourse Relation Recognition2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Toward Game-Based Learning of Japanese Writing for Elementary School Students2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] テキスト生成モデルによる日本語形態素解析2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Improving Commonsense Contingent Reasoning by Pseudo-data and its Application to the Related Tasks2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] KWJA: 汎用言語モデルに基づく日本語解析器2022

著者名/発表者名

学会等名

関連する報告書

大村和正京都大学, 情報学研究科, 特別研究員(DC2)