研究概要 |
本研究では,Webサイト毎の特性を利用して,最新トピックの検出・追跡を行う技術の確立を目的とする.具体的には,オンラインニュースで配信される最新トピックについて,そのトピックに興味を持ち,かつ迅速に反応するであろうWeb(ポータル)サイトを推定することにより,最新トピックの関連ページを効率よく収集・提示することを試みる.3年目にあたる今年度は,関連情報間の関連度計算手法の提案,これに基づく情報収集及び情報可視化を用いた対話型インタフェースを組み合わせたプロトタイプシステムの実装を行った.可視化対象オブジェクトを(Blogエントリ中で参照されている)ニュース記事,Blogエントリ,Blogサイトの3種類とし,同種オブジェクト間および異種オブジェクト間の関連度を前年度までの成果に基づき定義した.また,新聞記事をシードとして関連オブジェクトを収集し,関連度を求めるモジュールも実装した. 最新トピックの検出・追跡を行うためには,数多くのオブジェクトを考慮する必要があるが,これはユーザによる把握を困難にする.また,トピックの着目度や重要性を判断する指標は単一・固定的ではないため,ユーザに多様な観点からの手がかりを提供する必要がある.そこで本研究では,ある検索時点でユーザが着目しているオブジェクトと関連性に基づいて,可視化オブジェクトのフィルタリングおよび関連度の選択を行う手法を提案し,ユーザの操作履歴から着目オブジェクト・関連度を推定する手法についても提案した.開発したプロトタイプシステムを用いて被験者実験を行い,通常のブラウザおよびBlog検索エンジンを用いた場合(従来手法)と比較した結果,従来手法では利用可能な操作・手がかりが限られているため被験者の観点が限定されるのに対し,プロトタイプシステムを用いた場合は多様な手がかり・観点に基づきトピックやサイトが評価されることを示した.
|