研究概要 |
本研究の目的は,"タグ"による認識と画像認識を組み合わせることにより,飛躍的に高度でロバストな認識システムが実現可能になることを示すことにある。その要点は、1)タグを用いた対象の確実な認識により,ネットワークを通じて,膨大なデータベース情報の利用が可能になること、2)データベースより得られた形状データ等を利用することにより,対象の認識,姿勢や位置情報の取得といった画像認識が格段に容易になること、3)タグが実世界の対象と高速なネットワークとを結びつけることにより,複数のシステム間での知識の共有,情報の蓄積が容易になること、にある。 本年度の成果は下記の通りである。 1)モデルに基づく画像処理アルゴリズムの構築 "タグ"を介することにより対象の形状データ等が利用できるようになった状況を想定し、モデルが既知の場合に、画像中から対象を発見し、対象の姿勢や位置情報の推定、またイメージセンサ自体のパラメータの推定を行なう画像処理アルゴリズムを構築した。本手法は、1)無矛盾微分演算子を用いた画像中からの特徴点の検出、2)不変量に基づく3次元モデルの特徴点と画像上特徴点の対応関係の検出、3)対象の姿勢、位置情報、カメラパラメータの推定、からなっており、タグにより利用できるようになった対象に対する知識を最大限に利用して、高速かつロバストな画像認識を行なう特徴を有する。 2)RFタグリータとCCDカメラを用いた試作システムの構築 タグ融合型ビジョンの試作システムとして、RFタグリーダとCCDカメラよりなるシステムを構築した。また、実際に対象にRFタグを取り付け、CCDカメラで取得した画像に前述したアルゴリズムを適用することにより、実画像とモデルをマッチングさせる実験を行なった。具体的なデータベースの構築法として、XML等いくつか既存の形式の利点と問題点についても検討を行なった。
|