事象間関係知識の連続空間への埋め込みによる柔軟な推論機構の開発

研究課題

研究課題/領域番号	19K20332
研究種目	若手研究
配分区分	基金
審査区分	小区分61030:知能情報学関連
研究機関	北陸先端科学技術大学院大学 (2022-2023) 東北大学 (2019)
研究代表者	井之上直也北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (80778605)
研究期間 (年度)	2021-11-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円) 2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2019年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
キーワード	自然言語処理 / 質問分解 / マルチホップ推論 / 文脈内学習 / 言語モデル / 推論ルール / Wikipedia / ショートカット推論 / 含意関係推論 / 因果関係推論 / 人工知能 / 機械読解 / 知識ベース / 推論 / 埋め込み / 因果関係知識 / 事前訓練済み言語モデル / 事象間関係知識 / 常識推論
研究開始時の研究の概要	計算機の言語理解の実現に重要な常識推論の研究では、因果関係などの事象間の関係知識を用いてどのように柔軟に推論を実現するか、有効な手段はまだ見つかっていない。本応募課題では、大きく三つの課題に取り組む。第一に、研究実施の土台を整備するために、事象間関係知識のデータベースを構築する方法を確立する。第二に、これを用いて、事象間関係知識を連続空間上に埋め込み、推論を実現する技術を開発・評価する。第三に、従来から研究されている名詞間関係知識の推論技術と開発した技術を統合し、より高度な文章読解機構を実現する。構築した知識ベース、開発した埋め込み・推論技術については、一般公開し、広く利用できるものとする。
研究実績の概要	１．大規模言語モデルに基づく質問分解: 課題3の推論技術のプロトタイプとして、大規模言語モデルを知識ベースとみなし、与えられた質問を単純な質問に分解し、確信度高く回答できるようになるまで質問を分解して最終的な回答を導き出す手法を検討した (井之上ら2024)。既存の質問応答データセット StrategyQA (Geva et al. 2021) を用いてその効果を検証し、分解をしない手法に比べて、高い回答率を維持しながらも精度を向上させられることを確認した。２．日本語マルチホップ推論のベンチマークデータセットの構築: 推論技術の評価に向けて、多段推論を必要とする日本語の質問応答データセットを構築した (Ishii et al. 2024)。クラウドソーシングと大規模言語モデルによる半自動構築手法を用い、約1,000事例規模のデータセットを構築し、公開した。これを用いて既存の大規模言語モデルに基づく推論技術を評価し、その正解率は60%程度にとどまること、またエラー分析の結果より、訓練データにない知識を作り出してしまうことが大きな残課題であることを明らかにした。３．大規模言語モデルの文脈内学習の振る舞い分析: 大規模言語モデルを推論技術のベース技術とするにあたり、大規模言語モデルの詳細な振る舞いを分析した。具体的には、大規模言語モデルに与えたプロンプトから、言語モデルがタスクの入出力の形式を本当に学習できているのかを検証した (坂井ら2024)。その結果、プロンプトにおけるfew-shot事例の数と、所望の出力ラベルの確率の間には正の相関があることが確認され、大規模言語モデルには、確かにそうした能力があることが確認された。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由昨年度の予備調査により、大規模言語モデルを知識ベース及び推論器として用いることの有用性を確認したため、大きく方針転換を行い、大規模言語モデルの基礎的な振る舞い分析やベンチマークデータセットの構築に時間を費やしたため、計画に少し遅れが生じた。しかし、課題3の推論技術の研究開発に関する成果も出ており、全体としておおむね順調に進展しているといえる。
今後の研究の推進方策	2023年度は、大規模言語モデルを知識ベース及び推論器として活用し、これを外部からアルゴリズムにより制御することにより、高度な推論技術を実現できる見込みがあることを予備的に確認した。最終年度である2024年度には、確信度判断能力や質問分解能力の観点でこれをさらに発展させ、その性能を評価し、課題をまとめることに注力する。

報告書

(3件)

研究成果
(12件)

すべて 2024 2023 2020 2019 その他

すべて国際共同研究 (1件) 雑誌論文 (5件) (うち国際共著 1件、査読あり 3件) 学会発表 (5件) (うち国際学会 1件) 備考 (1件)

[国際共同研究] University College London(英国)
- 関連する報告書
  2019 実績報告書
[雑誌論文] R4C: A Benchmark for Evaluating RC Systems to Get the Right Answer for the Right Reason2020
- 著者名/発表者名
  Naoya Inoue, Pontus Stenetorp and Kentaro Inui
- 雑誌名
  
  Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL2020)
  
  巻: -
- NAID
  130007956034
- 関連する報告書
  2019 実績報告書
- 査読あり / 国際共著
[雑誌論文] 機械読解システムの推論過程のベンチマークの構築2020
- 著者名/発表者名
  井之上直也, Pontus Stenetorp, 乾健太郎
- 雑誌名
  
  言語処理学会第26回年次大会論文集
  
  巻: -
- 関連する報告書
  2019 実績報告書
[雑誌論文] 知識ベースとテキストの構成的同時学習2020
- 著者名/発表者名
  高橋諒, 井之上直也, 谷中瞳, 乾健太郎
- 雑誌名
  
  言語処理学会第26回年次大会論文集
  
  巻: -
- 関連する報告書
  2019 実績報告書
[雑誌論文] When Choosing Plausible Alternatives, Clever Hans can be Clever2019
- 著者名/発表者名
  Pride Kavumba, Naoya Inoue (equal contribution), Benjamin Heinzerling, Keshav Singh, Paul Reisert and Kentaro Inui
- 雑誌名
  
  Proceedings of the First Workshop on COmmonsense INference in Natural Language Processing (COIN2019)
  
  巻: - ページ: 33-42
- 関連する報告書
  2019 実績報告書
- 査読あり
[雑誌論文] An Empirical Study of Span Representations in Argumentation Structure Parsing2019
- 著者名/発表者名
  Tatsuki Kuribayashi, Hiroki Ouchi, Naoya Inoue, Paul Reisert, Toshinori Miyoshi, Jun Suzuki and Kentaro Inui
- 雑誌名
  
  Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL)
  
  巻: - ページ: 4691-4698
- NAID
  130007998368
- 関連する報告書
  2019 実績報告書
- 査読あり
[学会発表] 自己認知は LM as KB の信頼性を高めるか2024
- 著者名/発表者名
  井之上直也, 原口大地, 田中健史朗, 白井清昭, Natthawut Kertkeidkachorn
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] JEMHopQA:日本語マルチホップQAデータセットの改良2024
- 著者名/発表者名
  石井愛, 井之上直也, 鈴木久美, 関根聡
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] In-context Learning においてLLMはフォーマットを学べるか2024
- 著者名/発表者名
  坂井吉弘, 趙羽風, 井之上直也
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] JEMHopQA: Dataset for Japanese Explainable Multi-Hop Question Answering2024
- 著者名/発表者名
  Ai Ishii, Naoya Inoue, Hisami Suzuki and Satoshi Sekine
- 学会等名
  The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] 一般性を考慮した言語処理モデルのShortcut Reasoningの自動検出2023
- 著者名/発表者名
  原口大地, 白井清昭, 井之上直也
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実施状況報告書
[備考] R4C データセット
- URL
  https://naoya-i.github.io/r4c/
- 関連する報告書
  2019 実績報告書

事象間関係知識の連続空間への埋め込みによる柔軟な推論機構の開発

研究代表者

井之上 直也 北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (80778605)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] University College London(英国)

関連する報告書

[雑誌論文] R4C: A Benchmark for Evaluating RC Systems to Get the Right Answer for the Right Reason2020

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 機械読解システムの推論過程のベンチマークの構築2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 知識ベースとテキストの構成的同時学習2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] When Choosing Plausible Alternatives, Clever Hans can be Clever2019

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] An Empirical Study of Span Representations in Argumentation Structure Parsing2019

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] 自己認知は LM as KB の信頼性を高めるか2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] JEMHopQA:日本語マルチホップQAデータセットの改良2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] In-context Learning においてLLMはフォーマットを学べるか2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] JEMHopQA: Dataset for Japanese Explainable Multi-Hop Question Answering2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 一般性を考慮した言語処理モデルのShortcut Reasoningの自動検出2023

著者名/発表者名

学会等名

関連する報告書

[備考] R4C データセット

URL

関連する報告書

井之上直也北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (80778605)