2017 年度実績報告書

大量の映像群からテキストの内容に沿った映像を生成する映像要約手法の開発

研究課題

研究課題/領域番号	16K16086
研究機関	大阪大学
研究代表者	中島悠太大阪大学, データビリティフロンティア機構, 准教授 (70633551)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	映像要約 / 深層学習 / 部分映像検索 / 要約映像の評価
研究実績の概要	平成29年度はテキストに基づく要約映像の生成手法の開発に取り組んだ。この手法では、テキストに含まれる名詞と映像中に現れるオブジェクトの検出結果に基づいて映像とテキストの間の類似度を算出する手法をベースに、与えられたテキストと要約映像の類似度を最大化するように要約映像に含まれる映像を選出する。要約映像の評価として、ユーザが実際に提案手法を用いて要約映像を生成し、その結果に対するアンケート調査による主観評価を実施することで提案手法の有用性を確認した。また、昨年度研究開発を実施したテキストと映像をディープニューラルネットワークを用いて同一空間中に符号化することにより要約映像を生成する手法について、既存の評価指標の問題点を明確化し、新たな評価指標を提案した。既存の評価手法では、人が手作業で生成した要約映像や映像セグメントに対する重要度を正解データとすると作業差ごとのばらつきが大きいなどの問題があった。本研究では、ばらつきを考慮した評価手法を提案しており、論文誌として発表予定である。加えて、テキストに基づく要約映像の生成においては、長時間の映像からテキストに対応する部分映像を検索・抽出することにより、要約映像に含めるべき映像を抽出することが可能である。そこで、テキストと映像を同一空間中に符号化する手法をベースとして、テキストに対応する部分映像を検索する手法を提案した。この手法では、それぞれの映像フレームに対してクエリとなるテキストとの類似度を算出することにより、部分映像の検索を実現した。本手法自体の有用性の検証のために、映像に関する質疑応答システムを構築した。このシステムでは、映像中に与えられたテキストで記述されるシーンが含まれるかを判定し、回答する。

研究成果
(7件)

すべて 2018 2017 その他

すべて国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 2件、査読あり 2件) 学会発表 (4件) (うち国際学会 2件)

[国際共同研究] オウル大学/タンペレ工科大学(フィンランド)
- 国名
  フィンランド
- 外国機関名
  オウル大学/タンペレ工科大学
[雑誌論文] Summarization of User-Generated Sports Video by Using Deep Action Recognition Features2018
- 著者名/発表者名
  Tejero-de-Pablos Antonio、Nakashima Yuta、Sato Tomokazu、Yokoya Naokazu、Linna Marko、Rahtu Esa
- 雑誌名
  
  IEEE Transactions on Multimedia
  
  巻: 印刷中ページ: 印刷中
- DOI
  https://doi.org/10.1109/TMM.2018.2794265
- 査読あり / 国際共著
[雑誌論文] Video Summarization Using Textual Descriptions for Authoring Video Blogs2017
- 著者名/発表者名
  Otani Mayu、Nakashima Yuta、Sato Tomokazu、Yokoya Naokazu
- 雑誌名
  
  Multimedia Tools and Applications
  
  巻: 76 ページ: 12097-12115
- DOI
  10.1007/s11042-016-4061-3
- 査読あり / 国際共著
[学会発表] Finding Video Parts with Natural Language2018
- 著者名/発表者名
  Mayu Otani、Yuta Nakashima、Esa Rahtu、Janne Heikkila
- 学会等名
  情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
[学会発表] Fine-grained video retrieval for multi-clip video2017
- 著者名/発表者名
  Mayu Otani、Yuta Nakashima、Esa Rahtu、Janne Heikkila
- 学会等名
  Closing the Loop Between Vision and Language (CLVL) at ICCV
- 国際学会
[学会発表] Video Question Answering to Find a Desired Video Segment2017
- 著者名/発表者名
  Mayu Otani、Yuta Nakashima、Esa Rahtu、Janne Heikkila
- 学会等名
  Open Knowledge Base and Question Answering Workshop (OKBQA) at SIGIR
- 国際学会
[学会発表] Unsupervised Video Summarization using Deep Video Features2017
- 著者名/発表者名
  Mayu Otani、Yuta Nakashima、Esa Rahtu、Janne Heikkila、Naokazu Yokoya
- 学会等名
  画像の認識・理解シンポジウム(MIRU)

2017 年度 実績報告書

大量の映像群からテキストの内容に沿った映像を生成する映像要約手法の開発

研究代表者

中島 悠太 大阪大学, データビリティフロンティア機構, 准教授 (70633551)

研究成果

[国際共同研究] オウル大学/タンペレ工科大学(フィンランド)

国名

外国機関名

[雑誌論文] Summarization of User-Generated Sports Video by Using Deep Action Recognition Features2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Video Summarization Using Textual Descriptions for Authoring Video Blogs2017

著者名/発表者名

雑誌名

DOI

[学会発表] Finding Video Parts with Natural Language2018

著者名/発表者名

学会等名

[学会発表] Fine-grained video retrieval for multi-clip video2017

著者名/発表者名

学会等名

[学会発表] Video Question Answering to Find a Desired Video Segment2017

著者名/発表者名

学会等名

[学会発表] Unsupervised Video Summarization using Deep Video Features2017

著者名/発表者名

学会等名

2017 年度実績報告書

中島悠太大阪大学, データビリティフロンティア機構, 准教授 (70633551)