差分量子化によるビデオデータベースの自動アノテーションに関する研究
Project/Area Number |
24500104
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Media informatics/Database
|
Research Institution | Tohoku University |
Principal Investigator |
李 菲菲 東北大学, 未来科学技術共同研究センター, 助教 (70451549)
|
Co-Investigator(Kenkyū-buntansha) |
陳 キュウ 工学院大学, 工学部, 准教授 (00400292)
小谷 光司 東北大学, 工学(系)研究科(研究院), 准教授 (20250699)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Project Status |
Discontinued (Fiscal Year 2012)
|
Budget Amount *help |
¥5,200,000 (Direct Cost: ¥4,000,000、Indirect Cost: ¥1,200,000)
Fiscal Year 2014: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2013: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2012: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | マルチメディア / データベース / アルゴリズム / 情報システム / アノテーション |
Research Abstract |
光ファイバ接続サービスの発達などにより伝統的なテレビなどの視聴手段からオンライン動画視聴に変化しづつがある。一方、テレビで放送される映像や、ビデオカメラなどで撮影された映像などには、内容を説明したテキスト情報が存在しない。検索エンジンのように、キーワードなどを用いて簡単に意味に基づいた映像検索を実現するため、映像に対して、その内容を表すメタ情報をテキスト形式で付与するアノテーションの必要がある。本研究では、差分量子化によるヒストグラム特徴を用いて、ビデオの自動アノテーションを高精度かつ高速に実現する手法を試みた。今年度の研究成果は以下のようになる。 ビデオのフォーマットがいろいろあるが、現在もっとも標準的な動画圧縮フォーマットはMPEGである。圧縮アルゴリズムの基本原理は、MPEG-1、MPEG-2、MPEG4がH.263などと基本的には同様で、DCT変換やフレーム間予測、量子化、エントロピー符号化を採用している。 MPEGデータフォーマットのDC画像に差分量子化を適用することで、完全なMPEGデコードを実行することなく圧縮データから直接特徴ベクトルの生成が可能である。また、ITU-TのH.264規格はISOとITU-Tのジョイント規格で、MPEG-4 PISO/IECでは、ISO/IEC 14496-10「MPEG-4 Part 10 Advanced Video Coding(通称:MPEG-4 AVC)」としても規定されており、どちらも技術的には同一のものであり、DC画像の抽出もできるので、ほとんどのビデオフォーマットを対応できた。 また、顔インデキシング情報を得るため、高速かつ高精度の顔認識手法が必要である。今年度は顔認識手法の改善も検討した。画像の輝度情報を2次元離散コサイン変換(DCT)し、DCT 領域における低周波成分の位相及び振幅情報を抽出し組み合わせることにより、ロバスト性の高い顔特徴量が得られ、顔認識率が向上することを明らかにした。
|
Report
(2 results)
Research Products
(9 results)