本研究は、映像撮影者の意図に起因する重要領域推定の実現とそのアプリケーションの提案を目標とする。本年度は、重要領域推定のアプリケーションとして、下記の課題に取り組んだ。 1. プライバシー保護映像の自動生成 前年度に開発した、特に人物を対象とした重要領域推定手法によるプライバシー保護システムでは、映像中に偶然写りこんだ人物は重要ではないと考え、このような人物に対してのみぼかしなどを適用することによって自動的にプライバシー保護映像を生成する。このシステムでは、重要領域推定の誤りによってプライバシー情報が漏洩する可能性があることから、高い推定精度が要求される。本課題では、映像中に人物が複数登場する場合に、重要な人物同士の場合は空間的な相関があると考え、条件付き確率場によりモデル化する手法を開発した。これにより、ROC曲線下面積(Area Under Curve: AUC)で0.91の推定精度を達成した。さらに、プライバシー保護処理手法によるプライバシー保護の度合いについてもアンケート調査により明らかにした。 2. 重要領域推定の映像要約への応用 前年度に引き続き、重要領域推定の映像要約への応用に向けて、基盤となる映像要約手法の開発に取り組んだ。ここで提案する映像要約手法は、ユーザによって記述されたテキストに基づいて要約映像に含まれる映像を決定するものであり、映像とテキストの関連付けが必要となる。このとき、重要領域推定結果を利用することで、撮影者の意図に沿ったオブジェクトや動作に注目することが可能となる。この実現に向け、本課題では畳み込みニューラルネットワークを利用した映像とテキストの関連付け手法や、RGB-Dセンサから得られる映像からの動作認識手法を開発した。
|