• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

差分量子化によるビデオデータベースの自動アノテーションに関する研究

研究課題

研究課題/領域番号 24500104
研究機関東北大学

研究代表者

李 菲菲  東北大学, 未来科学技術共同研究センター, 助教 (70451549)

研究分担者 陳 キュウ  工学院大学, 工学部, 准教授 (00400292)
小谷 光司  東北大学, 工学(系)研究科(研究院), 准教授 (20250699)
キーワードマルチメディア / データベース / アルゴリズム / 情報システム / アノテーション
研究概要

光ファイバ接続サービスの発達などにより伝統的なテレビなどの視聴手段からオンライン動画視聴に変化しづつがある。一方、テレビで放送される映像や、ビデオカメラなどで撮影された映像などには、内容を説明したテキスト情報が存在しない。検索エンジンのように、キーワードなどを用いて簡単に意味に基づいた映像検索を実現するため、映像に対して、その内容を表すメタ情報をテキスト形式で付与するアノテーションの必要がある。本研究では、差分量子化によるヒストグラム特徴を用いて、ビデオの自動アノテーションを高精度かつ高速に実現する手法を試みた。今年度の研究成果は以下のようになる。
ビデオのフォーマットがいろいろあるが、現在もっとも標準的な動画圧縮フォーマットはMPEGである。圧縮アルゴリズムの基本原理は、MPEG-1、MPEG-2、MPEG4がH.263などと基本的には同様で、DCT変換やフレーム間予測、量子化、エントロピー符号化を採用している。 MPEGデータフォーマットのDC画像に差分量子化を適用することで、完全なMPEGデコードを実行することなく圧縮データから直接特徴ベクトルの生成が可能である。また、ITU-TのH.264規格はISOとITU-Tのジョイント規格で、MPEG-4 PISO/IECでは、ISO/IEC 14496-10「MPEG-4 Part 10 Advanced Video Coding(通称:MPEG-4 AVC)」としても規定されており、どちらも技術的には同一のものであり、DC画像の抽出もできるので、ほとんどのビデオフォーマットを対応できた。
また、顔インデキシング情報を得るため、高速かつ高精度の顔認識手法が必要である。今年度は顔認識手法の改善も検討した。画像の輝度情報を2次元離散コサイン変換(DCT)し、DCT 領域における低周波成分の位相及び振幅情報を抽出し組み合わせることにより、ロバスト性の高い顔特徴量が得られ、顔認識率が向上することを明らかにした。

  • 研究成果

    (2件)

すべて 2014 2013

すべて 学会発表 (2件)

  • [学会発表] Face Recognition Using Histogram-based Features in Spatial and Frequency Domains2014

    • 著者名/発表者名
      Qiu Chen, Koji Kotani, Feifei Lee, and Tadahiro Ohmi
    • 学会等名
      the Sixth International Conferences on Advances in Multimedia (MMEDIA 2014)
    • 発表場所
      Nice, France
    • 年月日
      20140224-20140224
  • [学会発表] Face Recognition Combined VQ Histogram and Energy Histogram in DCT Domain2013

    • 著者名/発表者名
      Qiu Chen, Koji Kotani, Feifei Lee, and Tadahiro Ohmi
    • 学会等名
      2013 International Conference on Electrical Engineering and Computer Sciences (EECS 2013)
    • 発表場所
      Hong Kong, China
    • 年月日
      20131221-20131221

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi