研究概要 |
本研究では,Webサイト毎の特性を利用して,最新トピックの検出・追跡を行う技術の確立を目的とする.具体的には,オンラインニュースで配信される最新トピックについて,そのトピックに興味を持ち,かつ迅速に反応するであろうWeb(ポータル)サイトを推定することにより,最新トピックの関連ページを効率よく収集・提示することを試みる.初年度にあたる今年度は,新規トピックの出現に迅速に反応するWebサイトの収集に関する検討を行った.Web上での新たな情報発信手段の一つとして注目を集めているBlogは頻繁かつ迅速な情報発信が行われている事に着目し,Blogサイトに適した情報収集インタフェースの検討,および情報源としてのBlogの特性について分析を行った. Blogサイトに適した情報収集インタフェースとして,Blogでは多様な話題が(通常のWebページよりも)短い記事単位によって公開されている点に着目し,従来Web検索のようなページ単位での情報提示ではなく,文書集合から求めたキーワード間の関連度を可視化し,キーワードの群れとして話題分布を提示するキーワードマップ型情報可視化システムをBlog検索向けに開発した.また,ユーザによるキーワードマップの編集操作から次の検索要求を推定する新たな適合性フィードバック手法を導入し,インタラクティブな検索を実現した. 情報源としてのBlogの特性については,オンラインニュースサイトで配信された記事をクエリーとして通常のWeb検索エンジンとBlog専用の検索エンジンを用いて検索を行い,時間経過に伴うヒット数の変化について比較実験を行った.その結果,単純なヒット数の比較ではWeb検索エンジンの方が多くのサイトを検索可能であるが,検索結果のほとんどが記事配信を行うサイトであり,記事に対する反応(コメント)の検索に関してはBlog検索の方が効率的であるとの知見を得た.
|