研究概要 |
H21年度は、動画像認識における新たな特徴抽出手法として、時空間勾配共起特徴(Space-time Auto-Correlation of Gradient, STACOG)を提案した。動画像は空間xy次元に加えて時間t軸を加えた3次元時空間データと見なすことができる。対象(人など)の動作はこの3次元における多様体(Motion Surface)として幾何学的に表現されるため、その幾何特徴を効果的に抽出することが動画像認識では重要となる。提案したSTACOG法では、基本的な幾何表現として3次元時空間勾配に注目し、さらにその近傍での共起性を抽出する。具体的には、3次元勾配を方向量子化することにより質的表現を得た後、テンソル計算を用いてそのような質的表現の共起特徴を算出する。そのため、STACOG特徴では勾配の分布のみならず、その共起分布の特徴も抽出することが可能となり、これらは幾何学的には勾配に加え曲率情報の抽出に相当する。さらに、質的表現を経た後に共起を算出しているため、計算量も非常に少ないという利点もある。 STACOG特徴を用いた新たな動画像認識の枠組みとしてBag-of-Frame-Features法も提案した。これは画像認識で用いられているBag-of-Features法を動画像へ拡張したものである。動画像では空間(frame)と時間は物理的に対等ではないため、その扱いを分け、動画像をframeから抽出したSTACOG特徴群で表現する。これにより動画像を密に表現することができ、STACOG特徴の性能と併せて、認識性能を向上させることができる。上記の提案手法を実際の動画像データに適用し動作認識実験を行ったところ、従来法と比較して良好な認識性能を得ることができた。
|