研究課題
情報化社会の進歩につれ、さまざまな分野におけるディジタル化技術の急速な発展により、複数のメディアが統合された高度マルチメディア情報処理環境の構築に対する要望が強い。しかし、現状のマルチメディア環境では、未整理で構造化されていないデータが溢れている。膨大なビデオデータベースを利用するには、人手を介さずに自動的にビデオのインデキシングに行うことが望まれている。本研究では、ビデオシーン切り替え検出し、人物が含まれるフレームに対して、高速かつ高精度で顔追跡をし、自動ビデオインデキシング手法を試みた。今年度の研究成果は以下のようになる。自動ビデオインデキシング技術を実現するため、前処理としてロバスト性のビデオシーン切り替え検出手法が不可欠である。現在標準的な動画圧縮フォーマットであるMPEGデータフォーマットのDC画像に差分量子化を適用することで、完全なMPEGデコードを実行することなく圧縮データから直接シーン切り替え検出を行った。公開のビデオデータベースからいくつかのMPEGビデオを用いて、従来手法に比べ、かなり良い結果が得られた。直接MPEGビデオのシーン切り替え検出が可能であることを示した。また、差分量子化によるヒストグラム特徴を用いて、時系列アクティブ探索法と組み合わせて、映像信号の高速探索法を提案した。汎用のPCを用いて、6時間分の映像から15秒の参照信号を従来の高速探索手法560ms掛かった1/7の時間80msの探索時間で正しく検出することを実現した。また、白色ガウス雑音に対しても、従来の高速探索手法によりロバストであることが分かった。SN比が30dB以上であれば、提案手法のほうは99.5%以上の探索精度が得られる。さらに、差分量子化による顔認識手法を改良した。顔認識パーツ分割処理を加えることにより、位置情報とヒストグラム情報を一緒に取り込み、総合判断することで顔認識率が向上することを明らかにした。現在最も標準的なFERETデータベースで評価した結果、表情、姿勢の変化を含むタスクにおいて、Top1認識率97.6%を得た。
すべて 2008
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (6件)
IEICE Electronics Express Vol.5, No. 14
ページ: 503-509