• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

未知の概念を含むクエリ文を用いた大規模映像からの詳細映像検索

研究課題

研究課題/領域番号 18K11362
研究機関明星大学

研究代表者

植木 一也  明星大学, 情報学部, 准教授 (80580638)

研究期間 (年度) 2018-04-01 – 2022-03-31
キーワード映像検索 / クエリ文 / TRECVID / 未知の概念 / 画像/言語の同時埋め込み
研究実績の概要

2021年度は,交付申請書に記載した【研究項目3】「クエリ文と映像から直接的に尤もらしさを出力する認識モデルの構築」と,【研究項目4】「全体の統合システムを作成して評価を実施」に関する研究を引き続き遂行した.
【研究項目3】については,近年提案されている画像/言語の同時埋め込み手法であるImproving Visual-Semantic Embeddings (VSE++),Graph Structured Matching Network (GSMN),Object Semantics Aligned Pre-training (Oscar),Contrastive Language-Image Pre-Training (CLIP)を用いて,映像検索への応用を検討した.VSE++,GSMNについては,説明文が付与されている画像を約3,000,000枚収集し,画像/言語の埋め込みの学習に利用した.一方,OscarとCLIPについては,自前で収集した画像よりも多くの画像を学習したモデルが公開されているため,それらを利用して映像検索に活用した.
【研究項目4】は,作成したシステムの性能をTRECVID映像検索ベンチマークに提出することにより評価した.GSMNで利用されている物体検出ベースの特徴抽出方法は,クエリ文からの映像検索においても有効であることがわかった.また,CLIPのように大量の説明文付きの画像を学習したモデルは汎用性が高く,どのようなクエリ文が入力された場合においてもロバストに検索が可能であった.また,説明文付きの映像データセットは,説明文付きの画像データセットに比べて極端にデータ数が少ないことから,現時点では,映像からフレーム画像を抽出して画像/言語の埋め込みモデルを用いる手法の方が,映像を高精度に検索できるということが明確となった.

  • 研究成果

    (4件)

すべて 2021

すべて 学会発表 (4件) (うち国際学会 2件)

  • [学会発表] ゼロショット画像検索のための画像と言語の対応付け手法 --サーベイ--2021

    • 著者名/発表者名
      植木 一也
    • 学会等名
      第27回画像センシングシンポジウム(SSII2021)
  • [学会発表] TRECVID映像検索ベンチマーク:AVSタスクへの6年間の挑戦と技術の進歩2021

    • 著者名/発表者名
      植木 一也
    • 学会等名
      ビジョン技術の実利用ワークショップ(ViEW2021)
  • [学会発表] Waseda_Meisei_SoftBank at TRECVID 2021: Ad-hoc Video Search2021

    • 著者名/発表者名
      Kazuya Ueki, Takayuki Hori, Yongbeom Kim, Yuma Suzuki
    • 学会等名
      Notebook paper of the TRECVID 2021 Workshop
    • 国際学会
  • [学会発表] Survey of Visual-Semantic Embedding Methods for Zero-Shot Image Retrieval2021

    • 著者名/発表者名
      Kazuya Ueki
    • 学会等名
      Proceedings of International Conference on Machine Learning and Applications (ICMLA)
    • 国際学会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi