構成性を考慮した自然言語理解テストセットの開発

研究課題

研究課題/領域番号	22K12167
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	豊橋技術科学大学
研究代表者	土屋雅稔豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (70378256)
研究期間 (年度)	2022-04-01 – 2027-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2026年度: 520千円 (直接経費: 400千円、間接経費: 120千円) 2025年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード	深層学習 / 質問応答 / 含意関係認識 / 自然言語理解
研究開始時の研究の概要	本研究は，質問応答タスクを題材として，深層学習によって得られたモデルの解釈性・信頼性に関する2つの目標を達成するためのデータセットを設計・構築する研究である．第1の目標は，評価対象モデルが，どのような質問に対して回答できるのかを予測することである．ある質問に対して人間が正しく推論できた場合，人間であれば正しく推論できるはずの別の質問を用意することによって，質問相互の性能の関係を評価できるよう設計する．第2の目標は，質問そのものに対する精度，信頼性を評価できる構成とすることである．収録する質問に対して複数の根拠テキストと回答を用意することにより，1つの質問に対する性能を評価できるように設計する．
研究実績の概要	本研究は，質問応答タスクを含む自然言語処理タスクを題材として，以下の2つの目標を達成するためのタスク定義とデータセットを設計・構築する方法を研究する．第1の目標は，データセットから深層学習によって得られたモデルが，どのような範囲の質問に対して回答できるのか，を予測することである．既存の質問応答データセットの作成にあたっては，収録されている複数の質問q1,q2,...は，お互いに独立している．そのため，ある質問qに対してモデルが正しく推論できた場合に，別の質問q'に対しても正しく推論できるかどうかを予測する方法は，基本的には存在しない．本研究では逆に，ある質問qに対して人間が正しく推論できた場合，人間であれば正しく推論できるはずの別の質問q'を用意することによって，モデルが人間をどこまで模倣できているかを検証できるよう設計するという方針を検討する．第2の目標は，質問そのものに対する精度，信頼性を評価できる構成とすることである．従来の質問応答タスクにおいては，質問q1と文脈テキストC1の対を入力として学習を行い，異なる質問q2と文脈テキストC2の対を入力としてテストを行っている．このタスク定義は，学習によって得られたモデルMが質問q1と文脈テキストC1の対を理解しているか調べる問題設定になっているが，モデルMが質問q1を理解しているか調べる問題設定としては不十分である．同一の質問q1を異なる文脈テキストC1およびC2に対して適用した時，そして，両方の文脈テキストに対して正しく回答できた場合，そのモデルMが質問q1を理解しているとみなすことができるはずである．そこで，本研究では，1つの質問に対して複数の文脈テキストを用意したデータセットを構築する方法を研究する．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 2023年度は，2022年度に引き続き，日本語Wikipediaを対象として構築された既存の質問応答データセットから収集した質問qと文脈テキストC，回答aを対象として，異なる文脈テキストC1,C2,...を用意する方法について検討した．具体的には，ウェブから収集した大規模テキストコーパスから，大規模言語モデルに基づいて，回答aを含み文脈テキストCと類似しているテキスト候補を収集し，収集されたテキスト候補が本当に文脈テキストとして利用可能であるかをクラウドソーシングにより判定する作業を実施した．先行研究と比較してクラウドソーシングの信頼性が低いことが明らかになったため，基盤言語モデルを用いたフィルタリングとクラウドソーシングの規模の変更などの工夫を行った．加えて，既存の質問応答データセットから学習されたモデルが，これらの新規の文脈テキストに対して，どのように振る舞うかを調査した．また，各種のデータセットの提案・構築・評価を進め，研究発表を行った．
今後の研究の推進方策	近年の深層学習モデルの急速な発展に伴い，深層学習モデルの信頼性や説明可能性を評価する手法の重要性は増すばかりである．そのため，引き続き，データセットから深層学習によって得られたモデルが，どのような範囲の質問に対して回答できるのか，質問そのものに対する精度，信頼性を評価できるか，という2つの目標を達成できるデータセットの構築方法についての検討を進める．ただし，近年の急速な大規模基盤モデルと Zero-shot アプローチの発展に対応する方針を併せて検討する．

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(8件)

すべて 2023 2022

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (5件) (うち国際学会 4件、招待講演 1件)

[雑誌論文] 日本語物語文を対象とする空所穴埋め問題データセット2022
- 著者名/発表者名
  Tsuchiya Masatoshi、Watarai Takuto
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 37 号: 4 ページ: A-LC3_1-12
- DOI
  10.1527/tjsai.37-4_A-LC3
- ISSN
  1346-0714, 1346-8030
- 年月日
  2022-07-01
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] SDCF: semi-automatically structured dataset of citation functions2022
- 著者名/発表者名
  Basuki Setio、Tsuchiya Masatoshi
- 雑誌名
  
  Scientometrics
  
  巻: 127 号: 8 ページ: 4569-4608
- DOI
  10.1007/s11192-022-04471-x
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] The Quality Assist: A Technology-Assisted Peer Review Based on Citation Functions to Predict the Paper Quality2022
- 著者名/発表者名
  Basuki Setio、Tsuchiya Masatoshi
- 雑誌名
  
  IEEE Access
  
  巻: 10 ページ: 126815-126831
- DOI
  10.1109/access.2022.3225871
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] Annotation Artifacts and Large-scaled Language Model2023
- 著者名/発表者名
  Masatoshi Tsuchiya
- 学会等名
  The 3rd International Conference on Technology, Informatics, and Engineering (Icon-TINE2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会 / 招待講演
[学会発表] Evaluating the Robustness of Question Answering Model against Context Variations2023
- 著者名/発表者名
  Takumi Matsuno and Masatoshi Tsuchiya
- 学会等名
  The 2023 International Conference on Advanced Informatics: Concepts, Theory and Application
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] テレビアニメ作品に関するSNS上の情報拡散傾向と感情の関係2023
- 著者名/発表者名
  石倉直樹, 土屋雅稔, 吉田光男
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Developing a Dataset of Overridden Information in Wikipedia2022
- 著者名/発表者名
  Masatoshi Tsuchiya, Yasutaka Yokoi
- 学会等名
  The 13th Language Resources and Evaluation Conference (LREC2022)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Automatic Approach for Building Dataset of Citation Functions for COVID-19 Academic Papers2022
- 著者名/発表者名
  Setio Basuki, Masatoshi Tsuchiya
- 学会等名
  The Sixteenth Linguistic Annotation Workshop (LAW-XVI)
- 関連する報告書
  2022 実施状況報告書
- 国際学会

構成性を考慮した自然言語理解テストセットの開発

研究代表者

土屋 雅稔 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (70378256)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] 日本語物語文を対象とする空所穴埋め問題データセット2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] SDCF: semi-automatically structured dataset of citation functions2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] The Quality Assist: A Technology-Assisted Peer Review Based on Citation Functions to Predict the Paper Quality2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Annotation Artifacts and Large-scaled Language Model2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Evaluating the Robustness of Question Answering Model against Context Variations2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] テレビアニメ作品に関するSNS上の情報拡散傾向と感情の関係2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Developing a Dataset of Overridden Information in Wikipedia2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Automatic Approach for Building Dataset of Citation Functions for COVID-19 Academic Papers2022

著者名/発表者名

学会等名

関連する報告書

土屋雅稔豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (70378256)