2022 Fiscal Year Annual Research Report

共参照クラスタを明示的に推定する先行詞の解析誤りに対し頑健な共参照解析手法

Research Project

Project/Area Number	21K17801
Research Institution	Nara Institute of Science and Technology
Principal Investigator	上垣外英剛奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)
Project Period (FY)	2021-04-01 – 2023-03-31
Keywords	知識グラフ / 知識グラフの埋め込み / 言語と画像 / 画像生成 / Infoboxの生成 / 事前学習済み言語モデル / 外部知識の利用 / 知識と画像
Outline of Annual Research Achievements	最終年度では本研究が予定したものと類似した共参照解析手法が他研究者より発表されたため，研究対象をより拡大し，言語と画像の融合や事前学習済み言語モデル(PLM)上で共参照解析をも含めた文脈理解を助けるための一手段として，外部知識を利用するための研究に注力した．PLMでの利用が期待される知識グラフ(KG)に関しては，KGの埋め込み手法(KGE)においてより頑健な推論を行うことが可能な学習手法を提案した．さらにKGのPLMにおける利用のための調査として，PLMを用いた要約生成において，指定した語句を出現するように学習することで忠実な出力を可能とする手法を提案した．また，言語と画像の融合分野(V&L)においては，使用されているモデルがどのように各タスクを解決するための知識を保持しているかの調査を実施した．これは外部知識を反映する際にどの部位を対象とすることが効率的であるかを確認するための事前調査である．さらに，V&Lで使用されているモデルを対象に，Wikipediaに存在するInfoboxを生成することで自然言語から獲得されたエンティティに関する知識がどれほどモデルに維持されているかを検証するためのタスク及びデータセットを提案した．作成したデータセットを用いた検証の結果，モデルはエンティティに関する知識の一部をV&Lデータを学ぶ際に忘却していることが判明した．また，画像生成においては外部知識であるInfoboxの情報を利用することで画像生成の精度が向上することが判明した．なお，これらの成果は第29回言語処理学会にて発表し，Infoboxを利用した研究は委員特別賞を受賞した．さらに同研究が自然言語処理分野のトップ国際会議ACL2023に採択された．このように研究期間を通じて事前学習済みモデルにおいて外部知識を利用するための手法及びそれを支援するための手法を実現することができた．
Remarks	言語処理学会第29回年次大会にて行った発表「視覚と言語の融合モデルにおける知識の振る舞いを調査するための表と画像の生成タスクの提案及びその調査結果」が委員特別賞を受賞

Research Products
(8 results)

All 2023 2022 Other

All Presentation (6 results) (of which Int'l Joint Research: 2 results) Remarks (2 results)

[Presentation] Table and Image Generation for Investigating Knowledge of Entities in Pretrained Vision and Language Models2023
- Author(s)
  Hidetaka Kamigaito
- Organizer
  The 61st Annual Meeting of the Association for Computational Linguistics
- Int'l Joint Research
[Presentation] 視覚と言語の融合モデルにおける知識の振る舞いを調査するための表と画像の生成タスクの提案及びその調査結果2023
- Author(s)
  上垣外英剛
- Organizer
  言語処理学会第29回年次大会
[Presentation] 知識グラフ補完のためのモデル予測に基づくサブサンプリング2023
- Author(s)
  Xincan Feng
- Organizer
  言語処理学会第29回年次大会
[Presentation] エッジプロービングを用いた事前学習済みの視覚と言語に基づくモデルにおける言語知識の分析2023
- Author(s)
  白井尚登
- Organizer
  言語処理学会第29回年次大会
[Presentation] 忠実性向上のためにn-gramの抽出性を報酬とする強化学習を用いる抽象型要約2023
- Author(s)
  星野智紀
- Organizer
  言語処理学会第29回年次大会
[Presentation] Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation Learning2022
- Author(s)
  Hidetaka Kamigaito
- Organizer
  The 39th International Conference on Machine Learning
- Int'l Joint Research
[Remarks] ICML2022で発表した内容を再現するための実装
- URL
  https://github.com/kamigaito/ICML2022
[Remarks] 言語処理学会第29回年次大会にて委員特別賞を受賞
- URL
  http://isw3.naist.jp/IS/PubWG/Events-ja/2023/award20230316_kamigaito.html

2022 Fiscal Year Annual Research Report

共参照クラスタを明示的に推定する先行詞の解析誤りに対し頑健な共参照解析手法

Principal Investigator

上垣外 英剛 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)

Research Products

[Presentation] Table and Image Generation for Investigating Knowledge of Entities in Pretrained Vision and Language Models2023

Author(s)

Organizer

[Presentation] 視覚と言語の融合モデルにおける知識の振る舞いを調査するための表と画像の生成タスクの提案及びその調査結果2023

Author(s)

Organizer

[Presentation] 知識グラフ補完のためのモデル予測に基づくサブサンプリング2023

Author(s)

Organizer

[Presentation] エッジプロービングを用いた事前学習済みの視覚と言語に基づくモデルにおける言語知識の分析2023

Author(s)

Organizer

[Presentation] 忠実性向上のためにn-gramの抽出性を報酬とする強化学習を用いる抽象型要約2023

Author(s)

Organizer

[Presentation] Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation Learning2022

Author(s)

Organizer

[Remarks] ICML2022で発表した内容を再現するための実装

URL

[Remarks] 言語処理学会第29回年次大会にて委員特別賞を受賞

URL

上垣外英剛奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)