Knowledge-Base-Grounded Language Models

研究課題

研究課題/領域番号	21K17814
研究種目	若手研究
配分区分	基金
審査区分	小区分61030:知能情報学関連
研究機関	国立研究開発法人理化学研究所
研究代表者	HEINZERLING BENJAMIN 国立研究開発法人理化学研究所, 革新知能統合研究センター, 副チームリーダー (50846491)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円) 2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円) 2021年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
キーワード	Language models / structured knowledge / interpretability / explainability / knowledge representation / knowledge base / language model / world knowledge / numeric properties / grounding / NLP
研究開始時の研究の概要	Just as a human processes text by relating it to her experience and knowledge, this proposal argues that language models (LMs) should relate text to a structured knowledge base (KB). Benefits of the proposed KB-grounded LM are alignment of text and KB, more efficient LM training, and applications in machine translation.
研究成果の概要	二つの主要な成果を達成しました。最初の成果は、構造化された知識のより良い統合を可能にする言語モデル（LM）のアーキテクチャです。LMは一般的に大量のテキストデータに基づいて訓練されますが、独自の社内知識ベースなどの特定の構造化された知識を統合することが望ましい場合がよくあります。ここでは、高価な再訓練を必要とせずにそのような統合を可能にするバイエンコーダアーキテクチャを開発しました。二つ目の成果は、LMが特定の種類の構造化知識、具体的には人の出生年や都市の人口などの数値的属性をどの程度うまく表現しているかを分析する解釈方法です。
研究成果の学術的意義や社会的意義	The first achievement provides an efficient method for integrating structured knowledge into existing language models, which allows users to adapt LMs to their specific needs without costly retraining. The second achievement improves our understanding of how LMs, thereby increasing transparency.

報告書

(4件)

研究成果
(11件)

すべて 2024 2023 2022

すべて雑誌論文 (11件) (うち国際共著 6件、査読あり 6件、オープンアクセス 11件)

[雑誌論文] Monotonic Representation of Numeric Properties in Language Models2024
- 著者名/発表者名
  Heinzerling Benjamin, Inui Kentaro
- 雑誌名
  
  preprint
  
  巻: -
- 関連する報告書
  2023 実績報告書
- オープンアクセス
[雑誌論文] Examining the effect of whitening on static and contextualized word embeddings2023
- 著者名/発表者名
  Sasaki Shota、Heinzerling Benjamin、Suzuki Jun、Inui Kentaro
- 雑誌名
  
  Information Processing & Management
  
  巻: 60 号: 3 ページ: 103272-103272
- DOI
  10.1016/j.ipm.2023.103272
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Prompting for explanations improves Adversarial NLI. Is this true? {Yes} it is {true} because {it weakens superficial cues}2023
- 著者名/発表者名
  Kavumba Pride、Brassard Ana、Heinzerling Benjamin、Inui Kentaro
- 雑誌名
  
  : Findings of the Association for Computational Linguistics: EACL 2023
  
  巻: 1 ページ: 2165-2180
- DOI
  10.18653/v1/2023.findings-eacl.162
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Can LMs Store and Retrieve 1-to-N Relational Knowledge?2023
- 著者名/発表者名
  Nagasawa Haruki、Heinzerling Benjamin、Kokuta Kazuma、Inui Kentaro
- 雑誌名
  
  Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop)
  
  巻: 4 ページ: 130-138
- DOI
  10.18653/v1/2023.acl-srw.22
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Test-time Augmentation for Factual Probing2023
- 著者名/発表者名
  Go Kamoda, Benjamin Heinzerling, Keisuke Sakaguchi, Kentaro Inui
- 雑誌名
  
  Findings of the Association for Computational Linguistics: EMNLP 2023
  
  巻: 0 ページ: 3650-3661
- DOI
  10.18653/v1/2023.findings-emnlp.236
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Cross-stitching Text and Knowledge Graph Encoders for Distantly Supervised Relation Extraction2023
- 著者名/発表者名
  Qin Dai, Benjamin Heinzerling, Kentaro Inui
- 雑誌名
  
  言語処理学会第29回年次大会発表論文集 (2023年3月)
  
  巻: 1 ページ: 0-0
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[雑誌論文] Cross-stitching Text and Knowledge Graph Encoders for Distantly Supervised Relation Extraction2022
- 著者名/発表者名
  Qin Dai, Benjamin Heinzerling, Kentaro Inui
- 雑誌名
  
  Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing
  
  巻: 1 ページ: 0-0
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] ニューラル言語モデルによる一対多関係知識の記憶と操作2022
- 著者名/発表者名
  松本悠太, 吉川将司, Benjamin Heinzerling, 乾健太郎
- 雑誌名
  
  言語処理学会第28回年次大会発表論文集 (2022年3月)
  
  巻: 0 ページ: 556-561
- 関連する報告書
  2021 実施状況報告書
- オープンアクセス
[雑誌論文] ニューラル言語モデルによる一対多関係知識の記憶と操作2022
- 著者名/発表者名
  長澤春希, Benjamin Heinzerling, 乾健太郎
- 雑誌名
  
  言語処理学会第28回年次大会発表論文集 (2022年3月)
  
  巻: 0 ページ: 1203-1208
- 関連する報告書
  2021 実施状況報告書
- オープンアクセス
[雑誌論文] Transformer モデルのニューロンには局所的に概念についての知識がエンコードされている2022
- 著者名/発表者名
  有山知希, Benjamin Heinzerling, 乾健太郎
- 雑誌名
  
  言語処理学会第28回年次大会発表論文集 (2022年3月)
  
  巻: 0 ページ: 599-603
- 関連する報告書
  2021 実施状況報告書
- オープンアクセス
[雑誌論文] COPA-SSE: Semi-structured Explanations for Commonsense Reasoning2022
- 著者名/発表者名
  Ana Brassard, Benjamin Heinzerling, Pride Kavumba and Kentaro Inui
- 雑誌名
  
  Proceedings of the 13th Language Resources and Evaluation Conference
  
  巻: 0
- 関連する報告書
  2021 実施状況報告書
- 査読あり / オープンアクセス / 国際共著

Knowledge-Base-Grounded Language Models

研究代表者

HEINZERLING BENJAMIN 国立研究開発法人理化学研究所, 革新知能統合研究センター, 副チームリーダー (50846491)

4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)

報告書

研究成果

[雑誌論文] Monotonic Representation of Numeric Properties in Language Models2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Examining the effect of whitening on static and contextualized word embeddings2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Prompting for explanations improves Adversarial NLI. Is this true? {Yes} it is {true} because {it weakens superficial cues}2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Can LMs Store and Retrieve 1-to-N Relational Knowledge?2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Test-time Augmentation for Factual Probing2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Cross-stitching Text and Knowledge Graph Encoders for Distantly Supervised Relation Extraction2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Cross-stitching Text and Knowledge Graph Encoders for Distantly Supervised Relation Extraction2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] ニューラル言語モデルによる一対多関係知識の記憶と操作2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] ニューラル言語モデルによる一対多関係知識の記憶と操作2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Transformer モデルのニューロンには 局所的に概念についての知識がエンコードされている2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] COPA-SSE: Semi-structured Explanations for Commonsense Reasoning2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Transformer モデルのニューロンには局所的に概念についての知識がエンコードされている2022