本研究は,実用性の高い,高性能のビデオ暴力度レーティング手法を開発することを目的とする.この目標は,(1)人物検出に基ついた時空間特徴プーリング技術,(2)グラフィック・モデルを用いた暴力要素認識結果の最適化技術,(3)リストワイズ・ランキングに基ついた暴力度レーティング手法の開発及び,(4)時空間並列処理の導入という4つのキーステップにより実現する. 今年度では、主に(1)時空間特徴のプーリング技術、(2)暴力要素認識結果の最適化技術、および(4a)時間上並列処理技術の研究開発を行いました。 (1)については、当初提案していた人物検出に基ついた時空間特徴プーリングというシャローラーニング手法を開発しましたが、高い有効性は確認できませんでした。そこて、研究方針を変更し、同じアイデアをSTN-CNNというEnd-to-end学習可能なデープランニング手法を用いて開発し、人物領域の時空間特徴プーリングを実現しました。詳細行動認識タスクにおいて、高い有効性を確認できました。 (2)については、当初提案していたグラフィック・モデルを用いた認識結果の最適化技術の開発を行いました。しかし、学習・テスト用のラベリング済みデータが足りないため、また十分な有効性検証を行っておりません。 (4a)については、IDTなどの時空間特徴をCNN時空間特徴に変更し、GPUベースの抽出手法を開発・実装しました。より高い特徴抽出速度を確認できました。
|