研究課題/領域番号 |
24500104
|
研究機関 | 東北大学 |
研究代表者 |
李 菲菲 東北大学, 未来科学技術共同研究センター, 助教 (70451549)
|
研究分担者 |
陳 キュウ 工学院大学, 工学部, 准教授 (00400292)
小谷 光司 東北大学, 工学(系)研究科(研究院), 准教授 (20250699)
|
キーワード | マルチメディア / データベース / アルゴリズム / 情報システム / アノテーション |
研究概要 |
光ファイバ接続サービスの発達などにより伝統的なテレビなどの視聴手段からオンライン動画視聴に変化しづつがある。一方、テレビで放送される映像や、ビデオカメラなどで撮影された映像などには、内容を説明したテキスト情報が存在しない。検索エンジンのように、キーワードなどを用いて簡単に意味に基づいた映像検索を実現するため、映像に対して、その内容を表すメタ情報をテキスト形式で付与するアノテーションの必要がある。本研究では、差分量子化によるヒストグラム特徴を用いて、ビデオの自動アノテーションを高精度かつ高速に実現する手法を試みた。今年度の研究成果は以下のようになる。 ビデオのフォーマットがいろいろあるが、現在もっとも標準的な動画圧縮フォーマットはMPEGである。圧縮アルゴリズムの基本原理は、MPEG-1、MPEG-2、MPEG4がH.263などと基本的には同様で、DCT変換やフレーム間予測、量子化、エントロピー符号化を採用している。 MPEGデータフォーマットのDC画像に差分量子化を適用することで、完全なMPEGデコードを実行することなく圧縮データから直接特徴ベクトルの生成が可能である。また、ITU-TのH.264規格はISOとITU-Tのジョイント規格で、MPEG-4 PISO/IECでは、ISO/IEC 14496-10「MPEG-4 Part 10 Advanced Video Coding(通称:MPEG-4 AVC)」としても規定されており、どちらも技術的には同一のものであり、DC画像の抽出もできるので、ほとんどのビデオフォーマットを対応できた。 また、顔インデキシング情報を得るため、高速かつ高精度の顔認識手法が必要である。今年度は顔認識手法の改善も検討した。画像の輝度情報を2次元離散コサイン変換(DCT)し、DCT 領域における低周波成分の位相及び振幅情報を抽出し組み合わせることにより、ロバスト性の高い顔特徴量が得られ、顔認識率が向上することを明らかにした。
|