研究概要 |
平成12年度は,ディジタル化されたビデオ教材を構造化し,目次を作成することを目標として研究を行った.また,構造化された教材に対して,部分的にハイパーリンクを張る研究を行った.ハイパーリンクを張る対象は,テレビで放映されているニュース映像を想定しており,今年度は、ニュース映像に対しても,構造化の研究を行った. 1.音声ディクテーション機能の強化:講師の発話には,言い淀みやいい間違いが含まれている.このような文法逸脱に対応できるよう,音声ディクテーションの機能を強化した.具体的には,話し言葉の言語モデルを使用し,認識の信頼度と話者適応を併用する音声ディクテーションの方法を提案した. 2.内容記述の統合:ニュース映像の各シーンにおいて,重要な映像フレームを統計的に判定し,その映像フレーム集合を作成することで,コンテンツの要約を作成する研究を行った. 3.映像中のオブジェクトに関するハイパーリンク:各シーンにおいて,映像中に映っているオブジェクトを抽出・追跡し,同じようなオブジェクトの動きを持つ映像について,同値類と判断して相互にリンクをはる研究を行った.しかし,映像中の物体を抽出・追跡する研究にとどまり,現時点では,まだ相互にリンクを張るところまで研究が進んでいない.平成13年度に,引き続き研究を行う予定である. 4.概念に対応するシーン集合を発見するための自己組織化:音声ディクテーションやテロップ・フリップから抽出したキーワードをベースに,1つの概念のまとまりを発見する研究を進めた.具体的には,テロップはコンテンツのまとめを表しているので,音声ディクテーションされたテキストからテロップの内容と関連の最も強い部分を自動的に取り出し,相互の関連を求めた.この音声テキストは,テロップが表す一つの概念に対応しており,これを基にコンテンツの要約を作成することができる.
|