• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

動画像理解のための深層状態空間モデリング法の展開

Research Project

Project/Area Number 19K12039
Research InstitutionChiba University

Principal Investigator

川本 一彦  千葉大学, 大学院工学研究院, 教授 (30345376)

Project Period (FY) 2019-04-01 – 2023-03-31
Keywords深層学習 / 状態空間モデル / 解きほぐし
Outline of Annual Research Achievements

本研究では、深層学習モデルと状態空間モデルを統合し、行動認識や動画生成といったコンピュータビジョン分野における動画像理解タスクへ応用展開する。昨年度までの研究で、動画像が行動属性や環境属性などに分離されて表現できれば、属性を制御しながらの生成や認識が可能になり、深層状態空間モデルでの状態表現として適していることが明らかになった。この知見をふまえて、本年度は次の研究を実施した。

動画像から静的特徴(時間不変な特徴)と動的特徴(時間可変な特徴)を別々に抽出し解きほぐすために、逐次変分オートエンコーダに基づく深層モデルを開発した。このモデルは、静的特徴と動的特徴に解きほぐすために2ストリームアーキテクチャを採用した。予備実験によると、2ストリームアーキテクチャを単純に用いるだけでは、静的特徴には動的特徴が含まれていることが多く、これらの解きほぐしが十分でないことが示された。さらに、動的特徴は潜在空間において識別性がないことも判明した。これらの問題に対処するために、敵対的分類器を用いた教師あり学習を2ストリームアーキテクチャに導入した。提案手法の有効性を定性的および定量的に実証するために、SpritesとMUGデータセットを用いて他の逐次変分オートエンコーダと比較した。提案手法は、教師学習による強い帰納的バイアスにより、動的特徴を静的特徴から分離し、動的特徴の識別可能な表現を得ることができることが確認できた。

  • Research Products

    (3 results)

All 2023 2022

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (2 results)

  • [Journal Article] Sequential Variational Autoencoder with Adversarial Classifier for Video Disentanglement2023

    • Author(s)
      Haga Takeshi、Kera Hiroshi、Kawamoto Kazuhiko
    • Journal Title

      Sensors

      Volume: 23 Pages: 2515~2515

    • DOI

      10.3390/s23052515

    • Peer Reviewed / Open Access
  • [Presentation] 動画像の解きほぐしに向けた敵対的補助分類器の効果検証2022

    • Author(s)
      芳賀壮、計良宥志、川本一彦
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] 動画像の解きほぐしに向けた補助分類器の効果検証2022

    • Author(s)
      芳賀壮、計良宥志、川本一彦
    • Organizer
      第25回画像の認識・理解シンポジウム

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi