2021 年度実績報告書

知識ベースを活用した視覚情報に関する質疑応答システムの実現

研究課題

研究課題/領域番号	18H03264
研究機関	大阪大学
研究代表者	中島悠太大阪大学, データビリティフロンティア機構, 准教授 (70633551)
研究分担者	金進東大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (40536893)
研究期間 (年度)	2018-04-01 – 2022-03-31
キーワード	質疑応答 / 知識ベース / 深層学習
研究実績の概要	画像や映像などの視覚情報に関する質疑応答（Visual Question Answering/Video Question Answering; VQA）は、機械と人の間の自然なインターフェイスなどのように様々な応用が考えられる技術である。本研究では、回答に際して知識が必要となる質問に対応可能なシステムを目指し、今年度は下記の課題に取り組んだ。（１）転移学習的なアプローチによる外部知識の置き換え：外部知識はテキストやグラフなどで与えられるものであり、容易に置き換えが可能である。この課題では、異なる2つのテレビドラマシリーズに関するVQAデータセットを構築し、それぞれの外部知識を相互に置き換える方法論を検討した。結果、置き換え先のデータセットでファインチューニングしない場合は、回答精度が大きく低下することがわかった。これはテレビドラマシリーズ間の語彙の違いなどによるものと予想される。登場人物などの固有名詞に対して何を表すかの付記（例えば、人物の固有名詞に対して「Person」を付記）や、データ拡張を実施した上で少数サンプルであってもファインチューニングすることで精度の向上が可能であることを示した。（２）知識の自動獲得：本研究では、外部知識としてそれぞれの質問に対して質問作成者によってテキストで付与された回答の根拠を利用するものを検討している。しかし、専用に記述された根拠ではその準備などにコストが掛かる。そこで、Wikipediaやまとめサイトのように、専用に記述されたものではなく、インターネット上で入手可能なテキストを外部知識として用いる手法を提案した。実験では、インターネット上に公開されたテレビドラマの各エピソードに関するまとめのテキスト（数文程度）を外部知識として利用することで、専用に記述された根拠より高い精度で質問に対して回答できることを明らかにした。
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

研究成果
(11件)

すべて 2022 2021 その他

すべて国際共同研究 (1件) 雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (6件) (うち国際学会 6件) 備考 (2件)

[国際共同研究] University of Oulu/Tampere University(フィンランド)
- 国名
  フィンランド
- 外国機関名
  University of Oulu/Tampere University
[雑誌論文] The semantic typology of visually grounded paraphrases2022
- 著者名/発表者名
  Chu Chenhui、Oliveira Vinicius、Virgo Felix Giovanni、Otani Mayu、Garcia Noa、Nakashima Yuta
- 雑誌名
  
  Computer Vision and Image Understanding
  
  巻: 215 ページ: 103333～103333
- DOI
  10.1016/j.cviu.2021.103333
- 査読あり / オープンアクセス
[雑誌論文] A comparative study of language transformers for video question answering2021
- 著者名/発表者名
  Yang Zekun、Garcia Noa、Chu Chenhui、Otani Mayu、Nakashima Yuta、Takemura Haruo
- 雑誌名
  
  Neurocomputing
  
  巻: 445 ページ: 121～133
- DOI
  10.1016/j.neucom.2021.02.092
- 査読あり
[学会発表] Quantifying societal bias amplification in image captioning2022
- 著者名/発表者名
  Yusuke Hirota、Yuta Nakashima、Noa Garcia
- 学会等名
  IEEE/CVF Conference on Computer Vision and Pattern Recognition
- 国際学会
[学会発表] Transferring domain-agnostic knowledge in video question answering2021
- 著者名/発表者名
  Tianran Wu、Noa Garcia、Mayu Otani、Chenhui Chu、Yuta Nakashima、Haruo Takemura
- 学会等名
  British Machine Vision Conference
- 国際学会
[学会発表] GCNBoost: Artwork classification by label propagation through a knowledge graph2021
- 著者名/発表者名
  Cheikh Brahim El Vaigh、Noa Garcia、Benjamin Renoust、Chenhui Chu、Yuta Nakashima、Hajime Nagahara
- 学会等名
  ACM International Conference on Multimedia Retrieval
- 国際学会
[学会発表] Image retrieval by hierarchy-aware deep hashing based on multi- task learning2021
- 著者名/発表者名
  Bowen Wang、Liangzhi Li、Yuta Nakashima、Takehiro Yamamoto、Hiroaki Ohshima、Yoshiyuki Shoji、Kenro Aihara、Noriko Kando
- 学会等名
  ACM International Conference on Multimedia Retrieval
- 国際学会
[学会発表] Explain me the painting: Multi-topic knowledge- able art description generation2021
- 著者名/発表者名
  Zechen Bai、Yuta Nakashima、Noa Garcia
- 学会等名
  IEEE/CVF International Conference on Computer Vision
- 国際学会
[学会発表] Visual question answering with textual representations for images2021
- 著者名/発表者名
  Yusuke Hirota、Noa Garcia、Mayu Otani、Chenhui Chu、Yuta Nakashima、Ittetsu Taniguchi、Takao Onoye
- 学会等名
  IEEE/CVF International Conference on Computer Vision Workshops
- 国際学会
[備考] KnowIT VQA
- URL
  https://knowit-vqa.github.io/
[備考] Art Description Generation
- URL
  https://sites.google.com/view/art-description-generation

2021 年度 実績報告書

知識ベースを活用した視覚情報に関する質疑応答システムの実現

研究代表者

中島 悠太 大阪大学, データビリティフロンティア機構, 准教授 (70633551)

研究成果

[国際共同研究] University of Oulu/Tampere University(フィンランド)

国名

外国機関名

[雑誌論文] The semantic typology of visually grounded paraphrases2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] A comparative study of language transformers for video question answering2021

著者名/発表者名

雑誌名

DOI

[学会発表] Quantifying societal bias amplification in image captioning2022

著者名/発表者名

学会等名

[学会発表] Transferring domain-agnostic knowledge in video question answering2021

著者名/発表者名

学会等名

[学会発表] GCNBoost: Artwork classification by label propagation through a knowledge graph2021

著者名/発表者名

学会等名

[学会発表] Image retrieval by hierarchy-aware deep hashing based on multi- task learning2021

著者名/発表者名

学会等名

[学会発表] Explain me the painting: Multi-topic knowledge- able art description generation2021

著者名/発表者名

学会等名

[学会発表] Visual question answering with textual representations for images2021

著者名/発表者名

学会等名

[備考] KnowIT VQA

URL

[備考] Art Description Generation

URL

2021 年度実績報告書

中島悠太大阪大学, データビリティフロンティア機構, 准教授 (70633551)