研究概要 |
近年,大量の映像データの高速処理や,効率的な検索・閲覧に関する研究が盛んである.研究代表者らもこれまでに9年以上にわたり,特定のニュース映像を毎日蓄積してきた.本研究課題では,ニュース映像アーカイブ中から出来事の変遷を表す時系列意味構造「トピックスレッド構造」を抽出し,それに実世界の多様な情報資源を関連づけることを目指している.具体的には,1)準同一(near-duplicate)画像・映像の利用による関連情報検出と,2)トピックスレッド構造への実世界情報資源の関連づけに取り組んでいる.これにより,ニュース映像アーカイブの時系列意味構造に沿って実世界の多様な関連情報を体系的に閲覧できるようになるため,アーカイブ中の映像の内容理解をよりよく支援できるようになると考える.本年度は,準同一映像の量的な利用可能性を検証するために,まず1週間程度の期間について,東京地区地上波放送局のニュース映像を照合し,準同一映像を検出した.この実験結果に応じて,準同一映像検出結果とテキスト情報の類似性の各々にどの程度重点をおくべきか検討し,他のニュース映像との関連づけを行った.また,複数のニュースストーリからなるトピックスレッド構造の部分構造に対して,放送年月日と文字放送字幕テキスト中の語句に注目し,対応するWikipedia記事を検出した,ニュース映像に正規化された見出しを付与する技術を開発した
|