2022 Fiscal Year Annual Research Report
Project/Area Number |
19K12039
|
Research Institution | Chiba University |
Principal Investigator |
川本 一彦 千葉大学, 大学院工学研究院, 教授 (30345376)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 深層学習 / 状態空間モデル / 解きほぐし |
Outline of Annual Research Achievements |
本研究では、深層学習モデルと状態空間モデルを統合し、行動認識や動画生成といったコンピュータビジョン分野における動画像理解タスクへ応用展開する。昨年度までの研究で、動画像が行動属性や環境属性などに分離されて表現できれば、属性を制御しながらの生成や認識が可能になり、深層状態空間モデルでの状態表現として適していることが明らかになった。この知見をふまえて、本年度は次の研究を実施した。
動画像から静的特徴(時間不変な特徴)と動的特徴(時間可変な特徴)を別々に抽出し解きほぐすために、逐次変分オートエンコーダに基づく深層モデルを開発した。このモデルは、静的特徴と動的特徴に解きほぐすために2ストリームアーキテクチャを採用した。予備実験によると、2ストリームアーキテクチャを単純に用いるだけでは、静的特徴には動的特徴が含まれていることが多く、これらの解きほぐしが十分でないことが示された。さらに、動的特徴は潜在空間において識別性がないことも判明した。これらの問題に対処するために、敵対的分類器を用いた教師あり学習を2ストリームアーキテクチャに導入した。提案手法の有効性を定性的および定量的に実証するために、SpritesとMUGデータセットを用いて他の逐次変分オートエンコーダと比較した。提案手法は、教師学習による強い帰納的バイアスにより、動的特徴を静的特徴から分離し、動的特徴の識別可能な表現を得ることができることが確認できた。
|
Research Products
(3 results)