研究概要 |
本研究の目的は,計算機による画像認識システムが実世界中の「物」を認識するための知識をWWW(World-Wide Web)から自動獲得するための手法を提案することである.具体的には, (1)WWWから様々な種類の物体の画像をできるだけ精度よく大量に自動収集し, (2)収集した画像を内容既知として,未知の実世界画像を自動分類するシステムを実現する ことを目的とする. 最終年度の本年度は,1000種類のキーワードに対応するWeb画像をそれぞれ1000枚以上収集するという大規模画像収集実験を本科学研究費で購入した18台の計算機クラスタを利用して実施した.その結果,キーワードによって大きく収集精度が変化することが分かった.上位113位までは適合率5割以上であった一方,805位以下は適合率1割未満であった.さらに,収集した画像を学習画像として一般画像分類を行う実験を実施した.収集した1000種類の画像のうち精度のよかった712種類について分類実験を行った結果,11.44%の分類精度を得ることができた. また,収集精度をより向上させる新しい手法として,一般画像認識で近年注目を集めているBag-of-keypoints画像表現をWeb画像収集に導入した新しいシステムを実現した.その結果,収集精度を10〜15%程向上させることができた.この成果は国際会議に投稿中である.さらに,今後はこの手法を用いて,1000種類の画像分類の実験も行う予定である.
|