研究概要 |
情報化社会の進歩につれ、さまざまな分野におけるディジタル化技術の急速な発展により、複数のメディアが統合された高度マルチメディア情報処理環境の構築に対する要望が強い。しかし、現状のマルチメディア環境では、未整理で構造化されていないデータが溢れている。膨大なビデオデータベースを利用するには、人手を介さずに自動的にビデオのインデキシングに行うことが望まれている。本研究では、ビデオシーン切り替え検出し、人物が含まれるフレームに対して、高速かつ高精度で顔追跡をし、自動ビデオインデキシング手法を試みた。今年度の研究成果は以下のようになる。 まず、差分量子化によるヒストグラム特徴を用いて、時系列アクティブ探索法と組み合わせて、MPEGビデオデータベースの高速探索法を提案した。現在標準的な動画圧縮フォーマットであるMPEGデータフォーマットのビデオデータは完全なMPEGデコードを実行することなく圧縮データから部分復号し、DC画像を生成することにより、ヒストグラム特徴を抽出できる。汎用のPCを用いて、6時間分のMPEGビデオデータから15秒の参照信号200本を探索する結果、従来の高速探索手法によりロバスト性の高い3%のERRを実現した。 また、差分量子化による顔認識手法について量子化方法を検討した。これまで、隣接画素の差分処理したあとに、x方向とy方向の差分dIx,dIyを極座標に変換し差分ベクトルの半径r、角度θで量子化をするが、dIX-dIyの平面を直接量子化する方法を検討し、dIx-dIy平面の直交座標を長方形の量子化領域を分割し量子化する手法を試みた。公開のAT&T顔データベースで評価した結果、直交座標での量子化方法は97.2%の最大平均認識率が得られた。オリジナル差分量子化手法の結果95.7%により大きく向上させた。
|