研究課題
本研究では、日々大量に提供される放送映像から自動的に画像認識のためのモデルを学習する手法について検討する。これは、映像アーカイブ検索のための映像内容解析や、人間と日常生活の中で対話するロボットのための視覚の実現などのために特に重要である。このような目的のためには、工業用ロボットの視覚のような精密な検出・計測は不要だが、一般の人間が常識として知っているきわめて多種類の物体を見分けたり、今後話題になりそうなまったく新しい物体を見分けるためのモデルが必要となる。本研究では、このような目的に利用可能な画像認識モデルを、放送映像から大量かつ動的に学習する手法の実現を目指す。平成18年度は、映像中の物体として顔に着目して、われわれの研究グループで蓄積している数年分のニュース映像、ならびにTRECVID(http://www-nlpir.nist.gov/projects/t01v/)により提供されているニュース映像を対象として、そこから顔を抽出し、LBP(Local BinaryPattern)に基づく顔照合アルゴリズムとRSCクラスタリングアルゴリズムを用いて人物ごとに分かれたクラスタを作成し、これと文字字幕情報(Closed Caption : CC)とを組み合わせて、顔と名前の対応づけを実現することにより、スケーラブルな顔認識モデルの自動構築を行った。また、一般画像の物体にも適用しうる手法への拡張を狙い、異なるカメラから同一物体を撮影している映像セグメントの同定のため、映像中の物体に対応する特徴点群の動きを追跡し、その軌跡の変化点のタイミングを照合するという手法を考案し、その効率の良いアルゴリズムを実現した。
すべて 2007 2006
すべて 雑誌論文 (22件) 図書 (1件)
情報処理学会論文誌, Vol. 48, No. 2,
ページ: 918-928
電気学会論文誌C Vol. 127 No. 3,
ページ: 359-366
Pattern Recognition Letters, Vol. 28,
ページ: Issue 9
ACM Symposium on Applied Computing (SAC), Multimedia & Visualization Track,
International Workshop on Multimodal Information Retrieval, In conjunction with IJCAL,
The Second IEEE International Workshop on Multimedia Databases and Data Management, In conjunction with ICDE,
European Conference on Information Retrieval, Rome, Apr. 2--5,
International Workshop on Content-Based Multimedia Indexing (CBMI2007),
International Conference on Multimedia and Expo (ICME2007), Beijing,
The Transactions of the Institute of Electronics, Information and Communication Engineers, Vol.E89-D No.7,
ページ: 2275-2285
電子情報通信学会論文集, Vol.J89-D, No.12,
ページ: 2699-2709
International Conference on Acoustics, Speech. and Signal Processing (ICASSP)
International Conference on Multimedia and Expo (ICME2006), Toronto,
Proc. of International Conference on Image and Video Retrieval (CIVR2006),
Proc. of International Conference on Pattern Recognition (ICPR2006)
Proc. of International Conference on Pattern Recognition (ICPR2006,
International Conference on Image Processing (ICIP2006),
Demo, ACM Multimedia,
IEEE Symposium on Visual Analytics Science and Technology (VAST),