これまでの映像アノテーションに関する研究は,その内容に応じて専門家がラベルを定義し,手動で収集された映像コーパスを前提としており,アノテーションを行うために必要なラベル及び学習データセットを自動的に取得することが困難であった.それに対して,本研究では,映像内容と関連するラベルを推定し,従来実現困難であった自動構築された映像コーパスを基にアノテーションを行う点,そして,その結果から類似シーンを関連付けて映像検索結果を提示する点が学術的に意義がある. ユーザが望む映像を的確に提示する技術であり,映像検索の効率化が見込め,インターネットを通じて映像を配信するサービスと柔軟に連携されることが期待できる.
|