本研究では、一連の行動で構成されているワークフローを収めたビデオデータに対して正しくフェイズを推定する手法とビデオデータを撮るカメラの位置が変化してもロバストにフェイズ推定を行うための行動推定手法を提案・検証している。 本研究では、ワークフローを収めたビデオデータの各時点における適切なフェイズラベルを出力することを目標としている。この目標を実現するため2つのフェイズ推定手法と2つの行動推定手法の提案と評価を行った。一般的なフェイズ推定手法はカメラの視点に依存しており、カメラの視点が変化すると、推定精度が著しく低下する問題がある。従って、本研究では、カメラ視点の変化に対応できる2つの行動推定手法を提案・検証した。具体的には、ORBバイナリ特徴量(FASTキーポイント検出器とBRIEF記述子の融合)とOFモーション特徴量の組み合わせた手法とアフィン変換、OFのヒストグラム、次元選択などの手法を用いてより高精度で視点にロバストな行動推定手法である。最後の手法は、単一視点のビデオから一連の異なる視点のビデオを、複数スケールのアフィン変換に基づく空間的なサンプリングアルゴリズムを用いて生成する。その後、局所的特徴量記述子として、生成されたビデオにおける固定サイズのパッチ毎に高密度OFのヒストグラムが計算される。最後に、特徴量ベクトル空間から主要な情報を持つ次元のみを残し、不要な次元を削除する次元選択手法を用いて推定精度を向上させる。評価実験として、自作したデータセットと公開データセットであるi3DPostなどを用いた精度評価を行った。特に、i3DPostを用いた評価実験では、既存の9つの手法と比較することができ、既存の手法より高い精度である、6行動推定では99.74%、10行動推定では96.72%の精度を出すことができ、提案手法の有効性を示した。
|