画像等、メディアデータの検索の場合、ユーザ意図に合致した検索を実施するには、検索者の持つ感覚的距離基準に合致した距離尺度を適応的に構築することが必要となる。本研究では、このような高度な検索の基本となる、画像特徴からの画像内容のモデル化や、検索キーからのユーザ検索意図のモデル化を行い、そのモデルに基づく検索方式を確立することが目的である。本年度の研究においては画像を対象として、画像間の類似度検索に関する研究を実施した。特に、検索キーとなる画像特徴の抽出手法と、画像特徴の確率モデルに基づくモデル化、それに基づく検索手法を中心とする研究を実施した。 画像間の類似度検索を実施するためには画像から特徴的な領域を抽出するとともに、特徴を記述するベクトル表現を求める必要がある。このため、本手法ではgraph-cutに基づく領域抽出法の一種であるgrab-cutアルゴリズムに着目し、この手法を実時間でも適用可能なように、階層型画像表現とこれを用いた逐次grab-cut手法を考案して高速化を行った。特徴抽出手法としては色ヒストグラム、エッジ方向性フィルタを用いた手法を実装した。この手法により得られた特徴量は類似度検索だけでなく、SVMを用いた手書きパターン識別などにも有効であることも確認した。 得られた特徴量は領域毎に得られるため、画像全体をモデル化するために、本研究では文書構造モデルで用いられるmixture of unigramモデルを採用し、混合正規分布モデルを用いて画像モデル化を行い、EMアルゴリズムに基づく学習アルゴリズムを実装した。画像の類似度検索を行うために、このモデルを用いて、まずクラスタに分類する手法を実装し、評価実験を実施した。MITで公開されているLabelMeデータベースを用い、人間が分類したクラスタとの一致度を調べ、本手法の有効性を確認した。
|