2010 Fiscal Year Annual Research Report
高解像度教育コンテンツ映像の大規模収録分析システム基盤の構築
Project/Area Number |
21700818
|
Research Institution | Kumamoto University |
Principal Investigator |
永井 孝幸 熊本大学, 総合情報基盤センター, 准教授 (00341074)
|
Keywords | 講義ビデオ / ハイビジョン / 自動収録 / 音声認識 / 発話分析 / 仮想カメラワーク |
Research Abstract |
本年度の研究では、まず昨年度開発した講義自動収録システムを遠隔自動収録用に改修し、1学期間にわたって毎週20科目以上の講義について鳥取-熊本間で遠隔自動収録を実施した.これにより、市販ハイビジョンカメラと安価な小型サーバのみを用いて、地理的に分散したキャンパスでの教育活動を日常的に収録可能であることを実証した。導入コストは1教室あたり20万円程度であり、本研究成果を利用することで、100教室規模の自動収録が数千万円程度のコストで実現可能となる。 次に、蓄積されたビデオ素材の大規模分析を可能にするため、素材分析用インフラの構築を行った。収録されたフルハイビジョン映像のままでは分析に要する計算量が多いため、高性能GPUを用いた映像フォーマット変換・映像フレーム間変化に基づくキーフレーム抽出などの処理を実装した。これにより、教師位置・講義スライドの検出を大量に行うことが可能となった。応用として、教師位置を追跡するカメラワークを算出し、素材ビデオを復習用の視聴に適した形式に加工する機能の実装を行った。また、生成されたカメラワークの評価の過程で、講師によってスライドを説明する際の立ち位置に大きな差があることが分かり、講義スタイルの判定にも利用可能なことが判明した。 音声についても同様に分析インフラの構築を行い、発話位置の検知・大量音声認識を実現可能とした。応用として200講義以上の音声を対象に音声特徴を集計し、発話状況が平均から外れた講義を検出することで,時間内演習などの特徴的な場面を抽出できることが分かった。 本研究成果により、数百科目規模の自動収録が現実的なコストで実現可能となり、高等教育機関における日常の教育活動の定量的な把握が可能となる。さらに教師の動き・板書・スライド・音声の特徴量を分析することで、効果的な教育活動を実施するための客観的な指標が明らかとなることが期待される。
|