Research Abstract |
World Wide Webや放送メディアで配信される大量かつ不均一な情報(作成者,作成の目的,メディアなどが異なる無関係な情報)から,マルチメディア事典コンテンツを自動構築するための基盤研究を行う.具体的には,テキスト,音声,画像ファイルを収集し,事物(専門用語,動植物,事件,人名など)に関する情報を抽出し,関連付け,再構成することで一貫性のある解説的コンテンツを構築する. 研究代表者の藤井は,IPA未踏ソフトウェア創造事業で,見出し語数75万語の事典コンテンツをWeb情報から自動構築した.当コンテンツは,事典検索サイトCyclone(http://cyclone.slis.tsukuba.ac.jp)で公開されている.しかし,Cycloneのコンテンツはテキスト情報だけなので,音声,画像を統合することでマルチメディア化を進める. 平成18年度は,テキストと動画像を対応付ける研究を行った.具体的には,講演ビデオを対象として,ビデオ中の音声情報を抽出し,音声認識システムによって自動的にテキストに転記し,さらに索引付けすることで,テキスト検索技術を用いて講演ビデオから特定のシーンを検索することを可能にした.講演音声の認識において,講演者の特徴と講演内容を考慮することで,音声認識の精度を向上させ,結果として検索精度を向上させることに成功した. さらに,Web上の主観情報を対象としてテキスト情報の特徴を可視化する研究,多言語情報を統合するための翻字手法に関する研究,娯楽・芸術コンテンツとして小説テキストを対象とした解析や検索の研究を行った.
|