研究課題
本研究では、写っているもののラベルが付いた大量の画像群から、対象物体の領域を自動抽出すると同時に、物体認識・検出器を学習する手法について検討する。学習用画像は、対象物体の外接矩形や物体領域を与える必要はなく、画像に対するラベルが与えられればよく、人手でも容易に付与可能であり、Flickrや文字字幕つき映像などからも大量に取得可能である。物体領域を自動抽出することにより、画像合成などにも利用できる上、より精密な認識・検出器の実現が可能となる。ラベル付き画像群から物体領域を自動抽出し、高精度の物体認識を実現する方法はいまだ国内外とも達成できていない。物体領域の自動抽出ができると、画像合成用の物体モデルが容易に構築可能となる。また、実現される物体認識手法は、大量マルチメディア情報の検索、マルチメディアマイニング、大量マルチメディア情報に基づく情報分析に有効であり、マルチメディア情報の意味解析のためのブレークスルーとなりうる。平成24年度は、画像の階層的セグメンテーション結果に基づく画像の部分領域の木構造による表現手法の開発、それをさらに画像群に拡張し、画像群内の各画像の部分領域まであらわした木構造表現の開発、分枝限定法に基づく効率の良い探索技術の開発を行った。これに、前年度成果であるMultiple Instance Learning(MIL)技術の拡張による物体領域の推定と画像の識別の同時最適化技術とを総合し、画像データベースから物体領域ならびに物体認識モデルの同時推定の可能性を示した。
すべて 2013 2012
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件)
IEEE Trans. on Circuits and Systems for Video Technology
巻: 未定 ページ: 未定
10.1109/TCSVT.2013.2248991
Image and Vision Computing
巻: Vol.30, No.1 ページ: 1-14
Journal of Real-Time Image Processing
10.1007/s11554-012-0280-7