研究概要 |
映像教材のサマリー情報は, 映像教材中のキー画面に相当する静止画とそれに付随する音声によって構成され, そのキー画面とキー音声の関係を調査した. さらに映像信号のフレーム内の相関を利用してキー画面を半自動的に抽出する手法を開発し, 検出部分や検出時間についての最適化を検討した. 研究状況は, 1)放送大学授業番組の中から文系, 科学系授業のタイプ別に7本の番組について, まず人為的にそれぞれキー画面, キー音声を抽出し, キー画面と判定された部分の画像の特徴を抽出した. その結果, キー画面はシーンとシーンが切り変わるカット部分に注目すること, キーワードはナレーションと画面中の文字によるスーパーインポーズ部分に着目する. 2)ナレーションに含まれるキーワードとそのシーンの出現する前後の状況の特徴および画面中に挿入されるスーパーインポーズのタイミングは, シーンの変化の前後5秒以内に集中してキーワードが表われる. 3)シーンの電子的な自動検出は画像部分の輝度の変化で大部分とらえられる. 3)画面のパーン部分で輝度がたえず変化し, シーンが連続して抽出される部分の検出方法については不感帯時間をもうけることを検討している. 4)以上の知見をもとに電子的方法により, 等間隔型(機械的に30秒とか1分ごとに等間隔に映像を取り出して編集する)とシーン対応型(電子的にシーンの変化を取り出して編集する)でサマリーを作成し評価実験を行った. その結果, シーン対応型は等間隔型に比べサマリー自動編集の方法として適していることがわかった. 今回は映像教材のシーンを抽出するために輝度変化を利用して電子的に行った. これは非常に安価な方法であるが, より正確に行うためにはフレム間相関をリアルタイムで行う方がよい. しかしこの方法は高速な映像処現をするため価格面で検討が必要である. 本研究での方法は, 映像のスクリーンニングという観点では実用的である.
|