研究概要 |
頑強な音声認識技術をビデオ教材の作成や利用に応用した場合、どの程度の改善効果があるかを実際にシステムを開発し、調査することを目的とし、本年度は以下の調査結果を得た。 1.ビデオシーン自動分割方法の検討・評価 講義ビデオ中の音声情報により、ビデオシーンを自動分割した。ビデオシーンの分割には、独立成分分析を用いたトピック表現(指標)とポーズ情報を利用した。シーンの対応付けには動的計画法を用い、隣接するシーンの余弦の総和が最小になるように最適化した。5人の教員による編集前の講義ビデオを用いて実験を行った結果、提案手法はHearst法と同等以上の分割性能を持ちながら、分割数を自由に設定できることがわかった。 2.ビデオ教材作成支援システムの開発・評価 ビデオ教材作成支援のために講義ビデオ素材を自動的にシーン分割し,ビデオ編集作業の負担を軽減できるシステムの開発を行った。また、編集前の講義ビデオ素材からビデオ教材を作成する際に音声情報より推定されたシーン分割位置を利用することがどの程度有効であるかを調査するため、開発した編集システムを用いて評価試験を実施した。評価試験の結果、使いやすさに関して、75%の被験者が自動シーン分割を行う方が使いやすいと回答した。ビデオ教材作成時間に関しては、音声情報により推定された自動シーン分割情報を用いることによって平均編集時間が1割以上削減できることがわかった。編集後のビデオ編集精度については、自動シーン分割し編集時間が削減しているにも関わらず、これまでと同等の精度を維持できることを確認した。 3.ビデオ教材の利用時の改善 予習や復習、独学でビデオ教材を利用する際に知りたいビデオ情報(シーン)がどこにあるかをすばやく検索する必要がある。キーワードによるビデオシーン検索実験の結果、3つのキーワードを指定すると、3位以内で約80%の再現率が得られることを確認した。
|