2005 年度実績報告書

グラフィカルモデリングを用いた音・映像知識資源の構造化の研究

研究課題

研究課題/領域番号	17300059
研究機関	東京工業大学
研究代表者	篠田浩一東京工業大学, 大学院・情報理工学研究科, 助教授 (10343097)
研究分担者	古井貞煕東京工業大学, 大学院・情報理工学研究科, 教授 (90293076)
キーワード	グラフィカルモデリング / マルチメディアコンテンツ / CBVIR / 知識の体系化 / セマンティクス
研究概要	現在、大量の音・映像知識資源が存在するが、多くの場合これらにはインデックス情報(ラベル)が付与されておらず、そのままの形では活用できない。このような大規模な音・映像知識資源を体系化し、利用する技術が強く求められている。このためには統計的パターン認識技術が不可欠であるが、十分な性能をもつ技術はない。また、ある程度の性能を得るためには、教師あり学習のためのラベルの付与が必要であるが、そもそもどのようなラベルを付与すべきなのかが必ずしも明確でなく、また、ラベル付けには多くの労力が必要である。そこで、本研究では、大量データに対する教師なしのラベル付けを様々な形態で行い、ラベル間の確率・統計的依存関係を抽出する、というアプローチをとる。本年度は、まず比較的付与すべきラベルが明確な題材を対象に評価用データベースの充実をはかった。NHK技研と協力し、野球放送を題材として、30試合についてプレイ内容などについて詳細なメタデータ付与を行った。また、特徴量抽出の検討を行った。具体的には、主成分分析、差分特徴量、カメラワーク特徴量、フラクタル特徴量、エッジ特徴量、オブジェクト検出、などである。これらの特徴量を離散化して、自己組織的なラベルとし、それを用いて最大エントロピー原理に基づく、シーンのモデル化を行った。従来しばしば用いられる隠れマルコフモデルと組み合わせる形で、評価実験を行い、シーン認識のタスクにおいてその有効性を確認した。

研究成果
(2件)

すべて 2006 2005

すべて雑誌論文 (2件)

[雑誌論文] Robust scene extraction using multi-stream HMMs for Baseball broadcast2006
- 著者名/発表者名
  H.-B.Nguyen, K.Shinoda, S.Furui
- 雑誌名
  
  IEICE Transactions on information and systems (未定)
[雑誌論文] Robust highlight extraction using multi-stream Hidden Markov Models for baseball video2005
- 著者名/発表者名
  H.-B.Nguyen, K.Shinoda, S.Furui
- 雑誌名
  
  Proc.International Conference on Image Processing 2005 (ICIP2005), Vol.III
  
  ページ: 173-176