研究概要 |
映像のようなマルチメディア処理の本質は,内容を理解することによるメディア統合にある.すなわち,音声,動画像などによって表現されている知識(内容)をメディア間で変換,要約,統合するための基盤技術を開発することが喫緊の課題である。本研究課題では,「内容」に踏み込んだマルチメディアオントロジーを新規に検討し,カテゴリーごとに定義されたドメインオントロジを動画像検索に適用することを第一の目的としている.また,ビデオマイニングの成果として得られるパターンから,ビデオオントロジを定義付けることを第二の目的としている.さらに,「意味概念空間での確率的時間プロセス」という考え方を導入し,オントロジで発見される概念間の関係をイベントとして定義する手法の開発を第三の目的としている.最終的に,上記の枠組みを統合し,動的な映像注釈技術を開発し,革新的な動画検索エンジンを開発する.本年度は,映像中での意味ある区間としてバーストと呼ぶ概念を定義し,映像からトピックを抽出する手法を開発した.また,新たにquery by shotsと呼ぶ,複数のクエリを用いてユーザの興味を持つトピックを検索する手法を開発した.本手法では、オントロジに基づく特徴選択を行い、検索に有用な特徴量のみを選択し、特徴空間の次元を削減する。つぎに,ラフ集合理論を導入して複数のクエリからトピック検索に有効な特徴量の組み合わせルールを求める.このようにして抽出されたルールを用いて映像検索を行う手法である。
|