常識推論タスク CommonGen のための文の非常識度合いの推定と常識的文への再生成

研究課題

研究課題/領域番号	23K11212
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	茨城大学
研究代表者	新納浩幸茨城大学, 理工学研究科(工学野), 教授 (10250987)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2025年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円) 2024年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円) 2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
キーワード	常識推論 / 制約付き文生成 / CommonGen / T5 / 生成文自動評価 / 大規模言語モデル / ChatGPT
研究開始時の研究の概要	CommonGen は数個の入力キーワードから，それらキーワードを用いた常識的な文を生成する制約付き文生成の常識推論タスクである．例えば「餌，彼，犬」の入力から「彼が犬に餌をあげる」などの文を生成するのが目標である．CommonGen の解決の鍵は生成された文が常識的かどうかを推定する手法（手法A）と，常識的でないと推定されたときの再生成の手法（手法B）である．本研究ではまず日本語 CommonGen のデータセットとベースラインとなるモデルを作成する．次に CommonGen の解決のための手法 A と手法 B を開発する．更に本研究では手法 A を利用した自動評価法も開発する．
研究実績の概要	本科研費申請後、ChatGPT が出現し、大規模言語モデル（Large Language Model、以下 LLM と略す）の能力が飛躍的に向上した。その結果 LLM を利用することで多くの自然言語処理のタスクに対する性能も向上した。本研究でタスクとした CommonGen は、数個の単語を与えて、それら単語を全て利用した常識的な文を生成するタスクである。このタスクは LLM を利用することで解決できることが予想できる。そこでこれまでに設定した文生成の困難な単語組を入力として、 ChatGPT （ LLMは GPT-3.5）がどの程度常識的な文を生成できるかを調べた。その結果、CommonGen のタスクに関しても LLM を利用することでほぼ解決できることが判明した。ただし一般的な常識推論に関してはまだ解決できていない部分があること、CommonGen タスクに対する LLM による回答となる生成文は長文になる傾向があることもわかった。この結果は情報処理学会の自然言語処理研究会で発表した（「鈴木雅人, 新納浩幸, "日本語 CommonGen に対する ChatGPT の性能調査", NL-256-7 (2023)」）。この研究結果をもとに、本年度は LLM の利用方法（具体的には OpenAI の LangChain の利用方法）や常識推論に対する能力について調査した。成果としては論文誌 1件、国際会議 2件、学会発表 6件である。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究で課題とした CommonGen タスクに対しては LLM を利用することでほぼ解決できることを示せたため、本研究課題の大部分は実質的に終了したとみなせる。ただし LLM の常識推論に関する能力については未知な部分も多い。本研究課題の本質的な部分は、 LLM の常識推論に関する能力の解明であるため、本年度は CommonGen を絡めて、その部分の調査研究を行う方針を立てた。このため全体的な進捗としてはおおむね順調に進展していると考えている。
今後の研究の推進方策	今後は CommonGen タスクを通した LLM の常識推論の能力に焦点を当てた研究を行う。具体的には文生成が困難な単語組（CommonGen の入力）のデータセットの構築方法を研究する。その過程で常識推論と文生成能力の関係について考察する。また構築したデータセットを利用して既存 LLM の評価も行う。構築方法については、申請時には単語間の関連性の低さと困難性に相関があり、その観点から構築方法を検討していたが、その方向では有望な実験結果は得られていないため観点を少し変更する。今後は以下の3つの観点で検討する。一点目は抽象名詞の利用である。本来、文生成が困難な単語として抽象名詞が存在する。その上で複数の抽象名詞間に関連性が低いと文生成が困難となる。二点目はその単語の利用頻度である。あまり利用されない名詞を使った文を生成するのは困難と思われる。三点目の観点は格である。例えば時間格や場所格は通常自由格になるので、自然に自由格になるような名詞の場合は文生成が容易である。また逆に格が固定的に使われる名詞の場合は、その名詞を使う文のバラエティが少ないため文生成が困難となる。以上の点から文生成が困難な単語組を集めたデータセットを作成し、既存の LLM の評価を行う。また人間が実際にそのような単語組から文生成を行うのにどの程度の負担を感じるかを測り、常識推論と CommonGen タスクとの関連を考察する。

報告書

(1件)

2023 実施状況報告書

研究成果
(9件)

すべて 2024 2023

すべて雑誌論文 (1件) 学会発表 (8件) (うち国際学会 2件)

[雑誌論文] Combining Generative Model and Attention Network for Anomaly Detection2024
- 著者名/発表者名
  Pei Zhou、Shinnou Hiroyuki
- 雑誌名
  
  Journal of Information Processing
  
  巻: 32 号: 0 ページ: 41-51
- DOI
  10.2197/ipsjjip.32.41
- ISSN
  1882-6652
- 関連する報告書
  2023 実施状況報告書
[学会発表] LLM を利用した文書分類のための Data Augmentation2024
- 著者名/発表者名
  小野寺優, 新納浩幸
- 学会等名
  第30回言語処理学会年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] RAGにおける小説データベースのChunk SizeとOverlap SizeとEmbeddingモデルの効果2024
- 著者名/発表者名
  阿部晃弥, 新納浩幸
- 学会等名
  第30回言語処理学会年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Prefix Tuning とキャラクタ属性の加減算を利用したキャラクタ風発話生成2024
- 著者名/発表者名
  藤原寛隆, 新納浩幸
- 学会等名
  第30回言語処理学会年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Data Augmentation by Shuffling Phrases in Recognizing Textual Entailment2023
- 著者名/発表者名
  Kyosuke Takahagi, Hiroyuki Shinnou
- 学会等名
  PACLIC
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Word Segmentation of Hiragana Sentences Using Hiragana BERT2023
- 著者名/発表者名
  Jun Izutsu, Kanako Komiya, Hiroyuki Shinnou
- 学会等名
  PRICAI
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] 日本語 CommonGen に対する ChatGPT の性能調査2023
- 著者名/発表者名
  鈴木雅人, 新納浩幸
- 学会等名
  情報処理学会第256回自然言語処理研究会
- 関連する報告書
  2023 実施状況報告書
[学会発表] English-Japanese multimodal machine translation using the CLIP model2023
- 著者名/発表者名
  崔少東, Ying Xinyan, 新納浩幸
- 学会等名
  情報処理学会第256回自然言語処理研究会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Zero-Shot Cross-Lingual Transferの評判分析における多言語モデルとMT + 単言語モデルの性能比較2023
- 著者名/発表者名
  佐藤匠真, 新納浩幸
- 学会等名
  情報処理学会第256回自然言語処理研究会
- 関連する報告書
  2023 実施状況報告書

常識推論タスク CommonGen のための文の非常識度合いの推定と常識的文への再生成

研究代表者

新納 浩幸 茨城大学, 理工学研究科(工学野), 教授 (10250987)

4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Combining Generative Model and Attention Network for Anomaly Detection2024

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[学会発表] LLM を利用した文書分類のための Data Augmentation2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] RAGにおける小説データベースのChunk SizeとOverlap SizeとEmbeddingモデルの効果2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Prefix Tuning とキャラクタ属性の加減算を利用したキャラクタ風発話生成2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Data Augmentation by Shuffling Phrases in Recognizing Textual Entailment2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Word Segmentation of Hiragana Sentences Using Hiragana BERT2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 日本語 CommonGen に対する ChatGPT の性能調査2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] English-Japanese multimodal machine translation using the CLIP model2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Zero-Shot Cross-Lingual Transferの評判分析における多言語モデルとMT + 単言語モデルの性能比較2023

著者名/発表者名

学会等名

関連する報告書

新納浩幸茨城大学, 理工学研究科(工学野), 教授 (10250987)