モデルに基づく3次元物体認識手法が多く開発されてきたが、定量的な情報に基づく剛体モデルの認識に関する研究がほとんどであった。本研究では、個々の物体の定量的変化を吸収した"カテゴリー"モデルに基づく定性的な物体認識のための物体モデルの自動構成を行なうビジョンコンパイラについての検討を行なった。当初、濃炎画像を入力とする2次元の見え方に基づく方法を予定していたが、形状クラスが多面体に限られ、一般性に問題があると考え、人体や顔などの自然形状を扱えるよう距離画像を入力とした3次元情報の利用を検討することにした。 物体モデルの自動構造をするためには、"カテゴリー"に内在する拘束の自動抽出を行なう必要がある。以下の方法により、同一"カテゴリー"に属する多数の画像から、物体モデルの自動構成を行なった。 1)各距離画像を物体を構成する基本プリミティブに階層的に分割する。 (2)階層的分割の結果から階層間関係および段層内関係を抽出する。 (3)階層間/内の関係拘束に基づき、分割記述同志をconstrained searchの手法により照合する。 (4)複数の分割結果に共通の構造を抽出し、階層的な記号的関係記述としてカテゴリーモデルを表現する。顔や手を撮影した多くの実距離画像(顔25枚、手7枚)を含むNRCC3次元画像データファイルを利用した多数枚の画像に基づく実験により、本手法の有効性を確認した。分割記述に基づく方法で、このような多数の実距離画像を扱った例は、世界的にも少なく、本手法のロバスト性を示すものである。
|