研究概要 |
本年度は,実験用データベースとして映像データベースを作成し,マルチメディア情報の大きな特徴である多次元性とデータ分布特性について解析を行った.高次元の特徴量空間は,マルチメディア情報の検索手法のひとつとして広く使われているが,最近の研究成果から,高次元空間では,低次元空間では想像できないような興味深い現象が起こることが明らかになっている.高次元空間の自由度があまりにも高いために点が散在してしまい,データ分布に激しい偏りが見られるようになるのである.そのような分布の偏りを考慮することによって検索処理を効率化する手法として,昨年度は「示差性感応型最近接点探索法(distinctiveness-sensitive nearest neighbor search) 」を考案した.この手法の評価を進めるに従い,特徴量空間におけるデータの分布特性は,簡単にモデル化できるものではなく,偏りの激しいものであることが明らかになってきた.そのため,マルチメディア情報検索の効率化手法を吟味するためには,実世界のデータを使い,実世界の具体的な用途に対して,提案手法を評価・改良する必要があることが明確になった.そこで今年度は,実世界の具体的なアプリケーションとして,放送映像を対象とした映像データベースを構築した.放送映像の中でも特に情報価値の高いニュース映像に焦点を絞り,同日の複数チャンネルのニュース映像を対象とした.このデータベースに対して高次元特徴量空間に基づく類似検索システムを実装し,特徴量空間におけるデータの分布特性について検証した.その結果,特徴量空間における実世界データの分布特性が明らかになるとともに,マルチメディア情報検索の効率化には,示差性感応型最近接点探索法のようなデータ分布の偏りに適合した手法が有効であることが明らかになった.
|