研究概要 |
本研究の目的は,計算機による画像認識システムが実世界中の「物」を認識するための知識をWWW (World-Wide Web)から自動獲得するための手法を提案することである.具体的には, (1)WWWから様々な種類の物体の画像をできるだけ精度よく大量に自動収集し, (2)収集した画像を内容既知として,未知の実世界画像を自動分類するシステムを実現する ことを目的とする. 本年度は2年目であり,1年目の研究成果をさらに発展させた.今年度は特に(1)を集中して行った.確率モデルに基づく画像認識の手法をWeb画像収集に導入するという新しい方法を提案し,精度を大幅に向上させることが可能となった.成果は国際会議で発表した.また,1000種類の画像をWebから収集する実験も実施中であり,来年度も継続して実施する予定である.最終的には1000種類のキーワードに対応する実世界画像データベースを実現する予定で,それを用いて,最終年度の来年度に(2)に関して,1000種類の画像分類システムを実現する予定である. 今年度から大量のデータを扱う研究段階に移行したため,昨年度準備した最新のPentium43.8GHzから成るクラスタ計算機システムを18台に増強し,データを分散させて処理を行った.効率的なデータ分散のためのソフトウエアの開発も行った.
|