研究概要 |
最終年度には熊本大学・鳥取環境大学で二百コマ以上の講義収録を実施するとともに、講義ビデオの著作権・肖像権保護に不可欠な以下の研究を実施した。 (1)講義スライド検出手法の改良:講師PCのビデオ信号を直接収録する方式では、画像変化量に対して単純閾値を用いてスライド切替えを検出するのが一般的であるが、本研究で前提とする講義室全景を収録した講義ビデオにはうまく適用できない。そこで、講義ビデオ中のプロジェクタスクリーン領域を小ブロックに分割し、各ブロックの変化量の出現確率に基づいてスライド変化を検出する手法を考案し実際の講義ビデオに適用した。 講義スタイル毎のスライド検出の見落とし率については分析中であるが、検出された場面を一覧することで講義ビデオ全体を見直すのに比べて大幅に少ない時間で講義中に利用されたスライドを把握することが可能になった。 (2)顔検出辞書の改良:講義ビデオに含まれる顔の検出精度を向上させるため、実際の講義ビデオから抽出した顔画像を用いて顔検出辞書の改良を行った。OpenCV画像処理ライブラリに付属している標準の顔辞書を用いて得られた検出画像を初期学習用画像データとし、Haar-like,HOG,LBPの各画像特徴量を用いて顔辞書を算出した。実際の講義ビデオから抽出した評価用顔画像を用いた顔検出性能の比較の結果、一般に顔検出に向いていると言われるHaar-like特徴量を用いた顔辞書よりも、HOG特徴量を用いた顔辞書のほうが高い検出率を示すことが確認できた。 その他、Androidタブレットを用いたスライド画像マスキングツールの試作や、ハイビジョン映像のRTSP配信用小型サーバの開発を行った。 本研究の成果によって講義ビデオ映像に含まれる顔・講義スライドの検出性能が向上し、講義ビデオ全体を見直すこと無く肖像権・著作権の保護を行えるようになることが期待される。
|