研究概要 |
本研究では、ビデオ情報の局所的な特徴、大局的な特徴・分類手法を研究・開発し、ビデオデータ内の自動的なセグメンテーションを第1の目的とし、さらに、セグメンテーションされたクリップ(ビデオのあるまとまった部分区間)同士の局所的・大局的類似性等を利用し、ビデオデータの自動的な構造化を目指すものである。本年度(〜平成20年3月31日)の研究では、まずビデオデータを分析し,昨年度の研究から得られた音響的な局所的特徴と大局的特徴を用いて,音声区間、音楽区間それぞれの自動判定を行う方式の研究を遂行し,同一楽曲内で繰り返される大局的音響特徴と音楽・音声の局所的音響特徴により音声・音楽の自動セグメンテーション方式を開発し,本方式の有効性を検証した。さらに、抽出された音声区間に対して、テキストあるいは音声を用いて検索語を設定することによりビデオ中の音声データの検索を行う手法(音声検索手法)についての研究を推進した。検索する言葉の検索のし易さを手掛かりとして、複数のサブワードを統合した検索手法の研究開発を行った。評価実験を通して、サブワードの自動統合方式としての有効性を検証した。これらの研究成果を国内外の学会で研究発表を行った。今後は、本研究成果の実応用化に向けた調査開発を推進する。
|