研究開始時の研究の概要 |
本研究では, 画像や動画が与えられたときに, その内容を説明する文 (キャプション) を出力するキャプション生成タスクに取り組む. キャプション生成の社会応用は多岐にわたり, 社会的ニーズは言語を問わず高い. キャプション生成を実装するためには, 通常, 対象言語の教師データが必要とされるが, その構築は高価であり大きな障害となっている. 本研究では, 対象言語の教師データを使うことなく, キャプション生成の実装を可能にするゼロショットキャプション生成法を開発する. これによって, キャプション生成を容易に (=教師データを構築するために高額な費用を支払うことなく) 実装できるようにする.
|