これまで約3年間にわたり、連日特定のニュース番組の映像を自動的に蓄積して映像コーパスを構築し、様々な利用技術に関する検討を進めているところである。本研究では、大規模映像コーパスを対象とした知的構造化に必要な以下の課題に取り組み、大規模ニュース映像コーパスへの効率的なアクセスの実現を目指している。 (課題1)大規模映像コーパスに対する既存技術の適用可能性の検証と改良 (課題2)大規模ニュース映像コーパスの知的構造化 (課題3)構造の可視化と構造を反映した効率的なアクセスインタフェースの実現 今年度は、既に別途取り組み始めていた、音声を書き下したクローズドキャプション(文字放送字幕)テキストに基づくトピック分割・追跡の精度や処理速度を上げることに取り組んだ。その結果、従来よりも5倍程度の速さで、トピックスレッドの第一階層の準最適解をほぼ実時間で探索できるようになり、動的に変化するインタフェースへの反映の実現可能性が示された。 一方で、そのようにして知的構造化がなされたニュース映像コーパスへのアクセスインタフェースを実現し、トピックスレッドを選択しながら、次々に関連トピックを追跡しながら閲覧できるようにした。 次年度以降は、画像から得られる手がかりも援用し、より意味内容に踏み込んだ追跡・スレッド構造解析を実現するとともに、インタフェースの操作性や適切な表示内容(キーワード・サムネイル画像など)について実証的に検討していく。
|