ゼロショットキャプション生成法の開発

研究課題

研究課題/領域番号	21K17811
研究種目	若手研究
配分区分	基金
審査区分	小区分61030:知能情報学関連
研究機関	千葉工業大学
研究代表者	重藤優太郎千葉工業大学, 人工知能・ソフトウェア技術研究センター, 主任研究員 (50803392)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	2,470千円 (直接経費: 1,900千円、間接経費: 570千円) 2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード	自然言語処理 / コンピュータビジョン / キャプション生成 / ゼロショット学習
研究開始時の研究の概要	本研究では, 画像や動画が与えられたときに, その内容を説明する文 (キャプション) を出力するキャプション生成タスクに取り組む. キャプション生成の社会応用は多岐にわたり, 社会的ニーズは言語を問わず高い. キャプション生成を実装するためには, 通常, 対象言語の教師データが必要とされるが, その構築は高価であり大きな障害となっている. 本研究では, 対象言語の教師データを使うことなく, キャプション生成の実装を可能にするゼロショットキャプション生成法を開発する. これによって, キャプション生成を容易に (=教師データを構築するために高額な費用を支払うことなく) 実装できるようにする.
研究成果の概要	FEVER タスクで事実検証器を学習する際の損失関数について分析を行い、FEVERに適した新たな損失関数を導入した。FEVER の学習においては、交差エントロピー損失がよく使われているが、これは FEVER のクラス間の関係を十分に考慮しているとはいえない。そのため、FEVER に適した（ラベル間の関係を考慮した）損失関数を開発し、数値実験においてその効果を示した。また、FEVER データは各クラス間のサンプル数が均一ではない不均衡データとなっているため、損失関数への重み付けによる性能改善も確認した。
研究成果の学術的意義や社会的意義	開発した損失関数は、任意のモデルに適用することができる。そのため、既存の検証器の学習に開発した損失関数を利用することで、既存検証器の性能を改善できる可能性がある。事実検証は、情報の正確性や妥当性などを検証するものであり、誤った情報の拡散とその影響を抑制する効果が期待できる。SNS の興隆や大規模言語モデルの台頭もあり、事実検証の需要はますます高まっている。本研究は、この事実検証に関する取り組みであり、社会的にも意義がある。

報告書

(4件)

研究成果
(1件)

すべて学会発表 (1件) (うち国際学会 1件)

[学会発表] Rethinking Loss Functions for Fact Verification2024
- 著者名/発表者名
  Yuta Mukobara, Yutaro Shigeto, Masashi Shimbo
- 学会等名
  The 18th Conference of the European Chapter of the Association for Computational Linguistics
- 関連する報告書
  2023 実績報告書
- 国際学会