前年度、「映像中の多種多様なイベントを検索可能にする」ことに関して、ラフ集合理論を用いて、数個のサンプル映像から、イベント検索に有用なパターンを動的に抽出する手法を開発したが、検索精度が低いという問題があった。この最大の原因は、従来のカテゴリカルなデータを対象としたラフ集合理論を使用するために、連続値データである映像の特徴量(色、エッジ、動きなど)を離散化していた点である。そこで、本年度は、類似度に基づいて、連続値データを直接的に処理可能な手法を開発した。また、検索精度を更に向上させるために、カラーレイアウト、エッジヒストグラム、リージョンシェイプといったMpeg-7準拠の特徴量の導入、領域分割による特徴量の空間情報の考慮、多重対応分析を用いたイベント検索に有用な特徴量の選択について検討した。最終的に、TRECVID 2008の映像データを対象として実験、評価を行い、前年度の手法と比べて、検索精度が大幅に改善されていることを確認した。そして、この研究成果に関して、1件の国際会議、1件の国内研究会にて発表を行った。 また、「イベントオントロジーの構築」に関しては、"人"、"車"、"空"といった、映像の意味内容を構成する基本的な概念(合計374個)の中から、ユーザから要求されたイベントに適切な概念を選択するためのオントロジーを構築した。そして、オントロジーを用いて概念を選択した方が、374個の概念全てを用いた場合に比べて、大幅に検索精度が向上することを確認した。しかしながら、この研究成果に関しては、本年度内に研究発表することができなかった。
|