研究概要 |
画像内容検索に関する研究は、盛んに行われてきているが、画像特徴量と利用者の主観とのギャップであるセマンティック・ギャップを埋めるには至っておらず、課題として残されている。そこで本研究では、対話型スケッチ画像検索において、知識発見手法を用いて膨大なデータベース画像、スケッチ図、ユーザの評価から、有用な情報を取得し、セマンティック・ギャップを埋め、検索精度、効率の向上させることを目的としている。 昨年度までの成果として、適合性フィードバックを用いたスケッチ画像検索では, ユーザの適合評価により入力スケッチと適合画像を関連付けることで、画像特徴量とユーザの主観との間に存在するセマンティック・ギャップを軽減させることを可能にした。今年度、ストローク毎に入力されるスケッチ全てを画像と関連付けることで、少ないストローク数で検索することを可能とした。しかしながら、適合性フィードバックの効果がスケッチの書き順に大きく依存することが課題として残っていた。考えられる書き順全てを関連付けることで理論上は対応可能であるが、データの巨大化が現実的な問題として発生する。そこで、部分的な書き順が類似するスケッチをデータマイニングにより抽出し、画像と関連付けることで、効率的に適合性フィードバックを活用する手法を提案した。提案手法の有効性を確かめるため、画像素材集Corel Photo Galleryの20,000点の画像を用いて検索実験を行い、Expected Search Length(ESL)を用いて定量評価したところ、検索効率の向上が確認できた。さらに、今年度、画像の大局的特徴量が抽出可能な相対的方向別頻度特徴量と局所的特徴量が抽出可能な高次局所自己相関特徴量を組み合わせた特徴量を用いた手法を提案し、有効性を検証した。
|