Research Abstract |
デジタル画像データの爆発的な増加に伴う計算機による画像の分類や検索に対する社会的ニーズ,ならびに,計算機による画像の内容や意味の理解という学術的探究心から,近年,画像を計算機に自動で認識させる「一般物体認識」と呼ばれる研究が注目を集めている.特に,計算機による自動認識という究極の目標への第一歩として,何がどこにあるのか,つまり,画像に含まれる物体の識別(カテゴリ認識)や検出(領域分割)の研究が活発に行われている. 同一カテゴリに属する物体であっても形状や色が異なることや,同一物体であっても視点や照明などの撮影条件に依存して見えが異なることから,物体の識別や検出は極めて困難な問題であるが,自然言語処理の分野に由来するBag of Features(BoF)と呼ばれる局所特徴に基づくアプローチが有効であることについては,一定のコンセンサスが得られつつある.しかしながら,BoFに基づく物体の識別に関する多くの研究は,一枚の画像に唯一のカテゴリの物体が存在することを仮定しており,様々なカテゴリの物体が共存するような一般的な画像を扱うのに適していない. 本研究課題では,物体識別に関して,様々なカテゴリの物体が一枚の画像に共存することを明示的に扱うと共に,カテゴリの共起しやすさというシーンのコンテキストを考慮した枠組みを提案した.具体的には,局所特徴ヒストグラムの線形結合に基づく尤度のモデル,および,共分散行列による共起関係のモデルから,最大事後確率推定により各カテゴリが画像中に存在する比率を推定する.一方,物体検出に関しては,物体カテゴリの空間的な連続性を考慮して,グラフカットを用いた枠組みを検討した.上述のようにして推定したカテゴリの存在比率を事前確率とみなすことで,ある局所特徴があるカテゴリの物体から生成される確率を計算できるために,カテゴリの共起関係を物体検出にも組み込むことができる.
|