本年度は1.時空間構造性を用いた行動の構造性学習・推論方法の定式化と、2.複数人・複数行動が存在するような行動認識データセット構築のためのシステム開発を行った。 1.時空間構造性を用いた行動の構造性学習・推論手法の定式化 まず、実環境で撮影した動画像データを解析し、本研究の対象である複数人行動(例えば「会話」)は準静的なものであり、行動における複数人の位置、方向といった空間的な位相関係(例えば「向かい合っている」といった関係性)が認識に有用であるという知見が得られた。得られた知見に基づいて定式化を行い、複数人行動における各々の人位置・方向を同時に記述する行動記述子、Contextual Spatial Pyramid Model(CSPM)を構築した。実験により、提案手法は、同一行動を行う人グループの認識を含めた複数人行動認識のタスクにおいて、複数人行動認識で用いられていたActionContextなどの手法より高い行動認識性能を得られることを確認した。以上の成果をまとめ、画像処理学会ECCV2012の併設ワークショップ、The 1st Workshop on Action Recognition and Pose Estimation in Still Imagesにて発表を行った。 2.複数人・複数行動が存在するような行動認識データセット構築のためのシステム開発 まず、所属研究室で開発された多視点カメラ環境を拡張し、長時間、行動の画像データを蓄積するためのデータ取得環境を整備した。更に、複数人存在下で、複数のグループに分かれて行われている行動に対する正解付けを行うためのツールを開発した。これは、例えば画像ベースのコミュニティ解析などの、複数人行動認識研究の新たな応用を拓くものとして重要である。構築したツールを用い、既存の複数人行動データセットと、本研究で新たに取得した画像データセットに対して行動のグループの正解付けを行い、行動認識研究のためのデータセットの整備を行った。
|