研究概要 |
本研究では、典型的な非テキスト情報である静止画像-特に単語で内容説明(アノテーション)が付けられた画像-をテキストで問い合わせるクロスメディア検索を対象とし,問い合わせと画像とを対応付ける検索モデルを開発している.中心的課題は検索モデル自動構築の際のデータが疎であることであり,複数メディアの組み合わせによりデータを補完するアルゴリズムにより,このボトルネックの解消を目指している. 本年度は,各種データセットを入手し,画像及びアノテーションの統計的性質を調査すること,また,性能評価実験のための計算環境の整備を行う計画であった. 前者については,欧州の研究者を中心に実施されている言語横断画像検索の評価型ワークショップへの参加を通じ,検索性能評価のために整備されたデータセットを入手することができた.また,これまでに開発した単言語クロスメディア検索モデルを言語横断検索の枠組みの中で活用する可能性を示した.性能評価実験結果を報告するワークショップにおいては,検索性能のみを見れば必ずしも優れていなかったものの,アプローチのユニークさにより,数多くの参加チームの中から口頭発表対象に選ばれるなど,提案検索手法を印象付けることができた. 後者については,評価実験およびデータ蓄積用の装置を導入し,大規模実験を可能とする環境がほぼ整った.また,当初は静止画像のみを対象として想定していたが,動画像も対象とすることで,周囲の研究者とのより強いコラボレーションが期待できることから,動画像処理にも対応可能な環境の整備も進めた. 上記に加え,秋ごろより外部の研究機関の研究者との研究交流を開始し,よりインタラクティブな側面を強調したクロスメディア検索方法についても検討を開始している.
|