2004 Fiscal Year Annual Research Report
ユーザや利用状況に適応した事典的コンテンツの自動生成
Project/Area Number |
16016206
|
Research Institution | University of Tsukuba |
Principal Investigator |
藤井 敦 筑波大学, 大学院・図書館情報メディア研究科, 助教授 (30302433)
|
Keywords | World Wide Web / 百科事典 / 情報検索 / 情報抽出 / 情報の組織化 / 自動要約 / 説明の観点 / 評価実験 |
Research Abstract |
World Wide Web上の情報を組織化して百科事典のように利用するために,研究代表者は検索サイト「Cyclone」を構築した.ユーザは,キーワード入力,質問文入力,可視化インタフェースなどによって,約70万語を収録したコンテンツから,言葉や事柄に関する説明テキストを効率良く検索することができる. 本研究は,Cycloneの事典コンテンツを状況に応じた形式に変換するための諸研究を行っている.本年度は,一つの見出し語に関する複数の説明を統合し,簡略化するための要約手法を提案した. 現状のCycloneでは,複数のWebページから個別に抽出された説明段落の一覧が提示される.しかし,説明段落の間には関連性がないため,キーワードに関して十分な説明を取得するためには,複数の段落を読む必要があり,その結果,同じような内容を何度も読まなければならない場合がある. 本研究では,複数文書要約を応用して,複数の説明段落から過不足ない単一の説明情報を自動生成する手法を提案する.あるキーワードに関する複数の段落を「定義」や「目的」といった説明の観点に基づいて解析し,観点ごとに代表的な説明文を選択し統合することで最終的な説明情報を構築する. その結果,少ない文字数で過不足ない説明情報を取得することができるようになった.また,携帯端末などのように一度に表示できる文字数が制限された環境への対応も容易になった. さらに,評価実験によって提案手法が有効であることを示した.
|