研究概要 |
本研究では,Webサイト毎の特性を利用して,最新トピックの検出・追跡を行う技術の確立を目的とする.具体的には,オンラインニュースで配信される最新トピックについて,そのトピックに興味を持ち,かつ迅速に反応するであろうWeb(ポータル)サイトを推定することにより,最新トピックの関連ページを効率よく収集・提示することを試みる.2年目にあたる今年度は,ニュースに対するコメントを含むBlog記事の収集および重要度測定に関する検討を行うと共に,Blogサイトに適した情報収集インタフェースの改良を行った. 最新トピックに関する情報を効率よく収集するためには,反応(コメントの投稿)が早いだけではなく,サイト自体の専門性,注目度なども考慮する必要があるため,Blog記事の重要度測定手法について検討した.具体的には,同一のニュースに対するコメントであっても,コメント作成者(ブロガー)のその分野における専門度や注目度によって,そのコメントが社会に与える影響は異なるとの考えから,トラックバック数,コメント数,ブログ過去記事とコメントとの類似度に基づきコメントの影響度を測定する手法を開発した. インタフェースに関しては,Blogでは多様な話題が(通常のWebページよりも)短い記事単位によって公開されている点に着目し,従来Web検索のようなページ単位での情報提示ではなく,文書集合から求めたキーワード間の関連度を可視化し,キーワードの群れとして話題分布を提示するキーワードマップ型情報可視化システムをBlog検索向けに開発した.昨年度開発したプロトタイプシステムに対話的機能を充実させることにより,利用者が試行錯誤的に検索結果を分析可能なシステムへの改良を行った.
|