研究課題
本研究では、日々大量に提供される放送映像から自動的に画像認識のためのモデルを学習する手法について検討する。これは、映像アーカイブ検索のための映像内容解析や、人間と日常生活の中で対話するロボットのための視覚の実現などのために特に重要である。このような目的のためには、工業用ロボットの視覚のような精密な検出・計測は不要だが、一般の人間が常識として知っているきわめて多種類の物体を見分けたり、今後話題になりそうなまったく新しい物体を見分けるためのモデルが必要となる。本研究では、このような目的に利用可能な画像認識モデルを、放送映像から大量かつ動的に学習する手法の実現を目指す。平成17年度は、ひとまず映像中の物体として顔に着目して、映像中の顔を高速に検出する手法について検討を行い、さらにこれを一般の物体に拡張するための特徴選択手法について検討を行った。また、フラッシュがたかれている同じシーンを異なる視点から撮影している映像セグメント間の照合を目的として、フラッシュ間隔の照合による映像照合手法について検討を行った。また、機械学習アルゴリズム(SVM)を用いた映像セグメントの意味分類手法の検討を行った。
すべて 2006 2005
すべて 雑誌論文 (5件) 図書 (1件)
The Transactions of the Institute of Electronics, Information and Communication Engineers (accepted for publication, 2006.)
International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2006.
International Conference on Multimedia and Expo (ICME2006), Toronto, 2006.
International Conference on Advances in Pattern Recognition, 2005.
British Machine Vision Conference, 2005.