研究概要 |
画像を含むデータベースを構築する際,何を検索の鍵とするか,また,その鍵をいかに自動的に抽出できるかが問題となっている.本研究では,画像を同じ領域と仮定するいくつかのセグメントに分割し,そのセグメントを記述することで検索の鍵として使う方法を検討した.対象としては,同一状況下の動画像に対し,人や物を抽出し記述することとした.そして,セグメンテーションでは,画像中の対象領域に対して望ましい輪郭上においてエネルギーが最小となるようなエネルギーモデルを定義し,このエネルギーの最小値を探索する動的輪郭モデルを基本とした手法を使うこととした.適応の方法としては,次の3つを検討した.(1)最初の画像に対し動的輪郭モデルを適応し,以後の画像の初期値として利用する.(2)各々の画像に対し動的輪郭モデルを適応し,その対応関係を記述する.(3)連続する画像に対しエネルギーを定義し,動的輪郭モデルを適応させる. これらに対し,次のような特徴があることが分かった.(1)は,対象物体の移動が十分小さく動的輪郭モデルの柔軟性で吸収できる場合に有効である.しかし,対象物体の移動が大きい場合は,あらかじめ動きを予測するなどの付加処理が必要となり,自動的に抽出するのは難しい.(2)は,各々の画像に対して初期値を必要とするが,各画像ごとに処理の大部分を実行できるので並列処理に適し,高速処理が期待できる.一方,対象物体の数が多くなるとその対応付けの計算量が増大する点が問題となる.(3)は,これまで画像平面内で定義していた輪郭のエネルギーを時間系列の連続画像に対して定義する方法である.この場合,時間系列も含めたモデル化が必要となり,汎用的に使える定義が難しい.そこで,相関の高い連続した数フレームの画像に対したエネルギーを定義することを検討したが,パラメータが増加するため最少解を得るのが難しく,現時点では望ましいエネルギーを定義できていない.今後は,(1)と(2)の手法の問題点に対する対策として(3)のエネルギーを定義したいと考えている.
|