2006 Fiscal Year Annual Research Report
Project/Area Number |
17300040
|
Research Institution | National Institute of Informatics |
Principal Investigator |
佐藤 真一 国立情報学研究所, コンテンツ科学研究系, 教授 (90249938)
|
Co-Investigator(Kenkyū-buntansha) |
HOULE Michael E. 国立情報学研究所, 情報学資源研究センター, 客員教授 (90399270)
片山 紀生 国立情報学研究所, コンテンツ科学研究系, 助教授 (60280559)
孟 洋 国立情報学研究所, コンテンツ科学研究系, 助手 (60312203)
|
Keywords | 映像インデクシング / 映像マイニング / 画像認識モデル / クラスタリング / マルチモーダル解析 |
Research Abstract |
本研究では、日々大量に提供される放送映像から自動的に画像認識のためのモデルを学習する手法について検討する。これは、映像アーカイブ検索のための映像内容解析や、人間と日常生活の中で対話するロボットのための視覚の実現などのために特に重要である。このような目的のためには、工業用ロボットの視覚のような精密な検出・計測は不要だが、一般の人間が常識として知っているきわめて多種類の物体を見分けたり、今後話題になりそうなまったく新しい物体を見分けるためのモデルが必要となる。 本研究では、このような目的に利用可能な画像認識モデルを、放送映像から大量かつ動的に学習する手法の実現を目指す。 平成18年度は、映像中の物体として顔に着目して、われわれの研究グループで蓄積している数年分のニュース映像、ならびにTRECVID(http://www-nlpir.nist.gov/projects/t01v/)により提供されている ニュース映像を対象として、そこから顔を抽出し、LBP(Local BinaryPattern)に基づく顔照合アルゴリズムとRSCクラスタリングアルゴリズムを用いて人物ごとに分かれたクラスタを作成し、これと文字字幕情報(Closed Caption : CC)とを組み合わせて、顔と名前の対応づけを実現することにより、スケーラブルな顔認識モデルの自動構築を行った。また、一般画像の物体にも適用しうる手法への拡張を狙い、異なるカメラから同一物体を撮影している映像セグメントの同定のため、映像中の物体に対応する特徴点群の動きを追跡し、その軌跡の変化点のタイミングを照合するという手法を考案し、その効率の良いアルゴリズムを実現した。
|
Research Products
(23 results)