ビデオ教材を最初に閲覧することによって、初学者にとって、その分野の概要を学習しやすい利点がある。しかし、再度、ビデオ教材を見返すためには、必要な部分を見つける必要があり、時間を要する。必要な部分を高速に検索することができれば、自学自習に有効である。講義ビデオ中から必要な部分を検索する方法として、目印をつけることができる付箋機能などが一般的である。またスライドを用いる講義の場合には、スライド中のキーワードを用いることができる。しかし、目印をつけてない場合やスライドを用いない講義の場合には再度閲覧したいところを高速に検索することは困難である。本研究では、ビデオ中の音声情報を利用し、どのような形式の講義ビデオに対しても、高速に検索できるシステムを開発することを目的とする。提案するビデオ検索システムでは、講義ビデオ音声より抽出したサブトピック情報を利用するため、目印やスライド中のキーワード、キャプションなどを必要としない。これにより、あらゆるビデオコンテンツに対応することができる。 平成21年度は、本校5回分の講義ビデオに加えて、豊橋技術科学大学の6講義について、シーン分割、シーン検索に関する最終評価試験を実施した。その結果、以下の知見が得られた。 (1)2種類のシーン分割方法を比較し、統計的なシーン分割方法がよいことが明らかになった。 (2)音声認識性能は講義ビデオシーン分割への影響が小さい。 (3)2つの教育機関でのビデオ素材に対して、同様の講義ビデオシーン分割性能が得られた。 (4)音声認識性能は話題検索性能への影響が大きい。 (5)発話されていないキーワードに対応するため、キーワードを辞書等の知識によって補完することにより、シーン検索性能が向上する。 (6)未知語や音声認識誤りに対応するためサブワード単位での検索を併用すると検索性能が向上する。 今後は、高専間教育素材共有システム(http://ctm.ishikawa-nct.ac.jp)に本研究の講義ビデオ検索機能を組み込む予定である。
|