本研究は、実用性の高い、高性能のビデオ暴力度レーティング手法を開発することを目的とする。この目標は、(1)人物検出に基ついた時空間特徴プーリング技術、(2)グラフィック・モデルを用いた暴力要素認識結果の最適化技術、(3)リストワイズ・ランキングに基ついた暴力度レーティング手法の開発、及び、(4)時空間並列処理の導入という4つのキーステップにより実現する。 今年度では、主に(1)人物検出に基ついた時空間特徴プーリング技術、(2)グラフィック・モデルを用いた暴力要素認識結果の最適化技術、(3)リストワイズ・ランキングに基ついた暴力度レーティング手法の開発、及び、(4b)空間上並列処理技術の研究開発を行った。 (1)について、前年度に提案したSTN-CNNベースのデープランニング手法を改良した。STNとCNN両方を一括に学習するのは非常に難しいため、STNの学習のための教師ありプレトレーニング手法を開発し、STN及びSTN-CNNの性能を大幅に向上させた。 (2)については、前年度実装したグラフィック・モデルの有効性を確認するため、新たに1930個のラベリング済みデータを用意し、評価実験を行いました。 (3)リストワイズ・ランキングに基ついた暴力度レーティング手法を開発し、ある程度の有効性を確認できた。レーティング精度をさらに向上させるため、Two-stream CNNとペアワイズ・ランキングを組み合わせた新しい手法を提案し、大幅の性能向上を確認出来た。 (4b)前年度(4a)と同様に、複数枚GPUを同時利用した特徴抽出手法を実装し、計算速度の向上を確認した。
|