研究概要 |
World Wide Webや放送メディアで配信される大量かつ不均一な情報(作成者,作成の目的,メディアなどが異なる無関係な情報)から,マルチメディア事典コンテンツを自動構築するための基盤研究を行う.具体的には,テキスト,音声,画像ファイルを収集し,事物(専門用語,動植物,事件,人名など)に関する情報を抽出し,関連付け,再構成することで一貫性のある解説的コンテンツを構築する. 研究代表者の藤井は,IPA未踏ソフトウェア創造事業で,見出し語数75万語の事典コンテンツをWeb情報から自動構築した.当コンテンツは,事典検索サイトCyclone(http://cyclone.slis.tsukuba.ac.jp)で公開されている.しかし,Cycloneのコンテンツはテキスト情報だけなので,音声,画像を統合することでマルチメディア化を進める. 平成19年度は,意見,批評,評判といったWeb上の主観情報を対象としてテキスト情報の特徴を可視化する研究,多言語情報を統合するための翻字手法に関する研究,日本語以外の言語で書かれたテキストに対する接辞処理と情報検索への応用研究,コンテンツを効率的に使用するための多言語質問応答インタフェースの研究を行った.その結果,客観的か主観的かといったテキストの記述に関する性質の違いや言語の違いを越えて,種々の情報を効率的に利用することが可能になった.さらに,構築したコンテンツやインタフェースを評価して,問題点を洗い出し,研究を総括した.
|