2022 Fiscal Year Research-status Report

Constructing Reading Comprehension Datasets to Evaluate Discourse-level Language Understanding

Research Project

Project/Area Number	22K17954
Research Institution	National Institute of Informatics
Principal Investigator	菅原朔国立情報学研究所, コンテンツ科学研究系, 助教 (10855894)
Project Period (FY)	2022-04-01 – 2025-03-31
Keywords	自然言語処理 / 計算言語学 / 自然言語理解
Outline of Annual Research Achievements	2021年度後半から2022年度にかけて大規模なパラメータ数からなるアーキテクチャを大規模なコーパスの上で訓練することで構築した大規模言語モデルと呼ばれるシステムを基礎にした研究が急増している。そのなかで、本研究はとくに文の相互関係の理解に注目し、説明性の高い談話的文章理解を問う評価用データセットの構築を目指している。高度化したシステムの振る舞いを評価するにあたって単文にとどまらない複数の文の理解を総合的に問うアプローチは重要性が高く、集中的に取り組まれる必要がある。大規模言語モデルの発展と軌を一にして、言語理解の評価用のデータセットも多様化・大規模化する傾向があり、現状のデータセットで何が取り組まれており、現状のシステムに何ができるのか、広範で正確な調査が必要とされている。初年度においてはこうした進展を踏まえた文献調査を進めながら、システム分析・簡易的なデータセット作成を通した状況把握に努めた。具体的には、読解問題における文章に含まれる表面的な特徴が文章読解システムの振る舞いのどのような影響を与えているのかを調査した。また、日付情報の理解や常識推論の理解をシステムに問うことを通して、複数の文を同時に理解しなければならないタスクでシステムが適切に振る舞うことができるのかを調査した。このような予備的な調査を通して、今後文間の理解を正確に評価するタスクをデザインする上で重要になる知見などを収集した。
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 直近1,2年で大規模言語モデルが著しい発展を見せており、これをもとにしたシステムの再現や現状の能力の把握に努めることを優先したため、データセットの構築までの着手に至っていない。また、システムの発展と同様に言語理解の評価用のデータセットも多様化・大規模化する傾向があり、現状のデータセットで何が取り組まれており、現状のシステムに何ができるのか、広範で正確な調査が必要とされている。初年度においてはこうした進展を踏まえた文献調査を進めながら、関連した研究を通して現行のシステム・ベンチマークについて知見を得るに留まった。
Strategy for Future Research Activity	次年度も同様に調査を中心に進め、現状ひろく使われているシステムの再現や現状の能力の把握・有力なデータセットにおける評価項目・振る舞いの調査の網羅的に進める。本研究が目的としている評価用データセットの構築をより有意義なものとするため、とくに文関係の把握に注目し、重要な言語現象が評価対象になっているのか、システムはどのような性能を示しているのかについて理解を深めることを最優先目標とする。状況が進み次第、具体的なデータセット構築の手段を再考して着手する。その際、クラウドソーシングにとどまらず既存の有力なモデルによる生成を前提とした手法も前向きに検討する。
Causes of Carryover	今年度は調査を中心に進めたため、データセット構築を目的とした予算の使用が発生しなかった。

Research Products
(5 results)

All 2023 2022

All Journal Article (5 results) (of which Peer Reviewed: 5 results, Open Access: 5 results)

[Journal Article] Penalizing Confident Predictions on Largely Perturbed Inputs Does Not Improve Out-of-Distribution Generalization in Question Answering2023
- Author(s)
  Kazutoshi Shinoda, Saku Sugawara, Akiko Aizawa
- Journal Title
  
  Proceedings of the Workshop on Knowledge Augmented Methods for NLP
  
  Volume: 1 Pages: -
- Peer Reviewed / Open Access
[Journal Article] Which Shortcut Solution Do Question Answering Models Prefer to Learn?2023
- Author(s)
  Kazutoshi Shinoda, Saku Sugawara, Akiko Aizawa
- Journal Title
  
  Proceedings of the 37th AAAI Conference on Artificial Intelligence
  
  Volume: 1 Pages: -
- Peer Reviewed / Open Access
[Journal Article] How Well Do Multi-hop Reading Comprehension Models Understand Date Information?2022
- Author(s)
  Xanh Ho, Saku Sugawara, Akiko Aizawa
- Journal Title
  
  Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing
  
  Volume: 1 Pages: 470-479
- Peer Reviewed / Open Access
[Journal Article] Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios2022
- Author(s)
  Mana Ashida, Saku Sugawara
- Journal Title
  
  Proceedings of the 29th International Conference on Computational Linguistics
  
  Volume: 1 Pages: 3606-3630
- Peer Reviewed / Open Access
[Journal Article] Look to the Right: Mitigating Relative Position Bias in Extractive Question Answering2022
- Author(s)
  Kazutoshi Shinoda, Saku Sugawara, Akiko Aizawa
- Journal Title
  
  Proceedings of the Fifth BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP
  
  Volume: 1 Pages: 418-425
- Peer Reviewed / Open Access

2022 Fiscal Year Research-status Report

Constructing Reading Comprehension Datasets to Evaluate Discourse-level Language Understanding

Principal Investigator

菅原 朔 国立情報学研究所, コンテンツ科学研究系, 助教 (10855894)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Penalizing Confident Predictions on Largely Perturbed Inputs Does Not Improve Out-of-Distribution Generalization in Question Answering2023

Author(s)

Journal Title

[Journal Article] Which Shortcut Solution Do Question Answering Models Prefer to Learn?2023

Author(s)

Journal Title

[Journal Article] How Well Do Multi-hop Reading Comprehension Models Understand Date Information?2022

Author(s)

Journal Title

[Journal Article] Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios2022

Author(s)

Journal Title

[Journal Article] Look to the Right: Mitigating Relative Position Bias in Extractive Question Answering2022

Author(s)

Journal Title

菅原朔国立情報学研究所, コンテンツ科学研究系, 助教 (10855894)