研究概要 |
平成14年度は,主として下記の研究を行った. 1.アンカーテキストに基づく検索手法 大規模なWeb情報を対象にした組織化・構造化の手法,並びに検索や分類などの情報アクセス手法について検討している. 平成14年度は,Webページに含まれるアンカーテキストに着目した検索手法について検討した.その実現可能性について大規模テストコレクションを用いて吟味したところ,アンカーテキストに基づく当該手法は主題検索には必ずしも有効でないことを示唆する結果が観察された.既知事項検索などに適用した場合の有効性について,さらなる検討の必要性が明らかになった. 2.Web情報アクセスシステムの評価手法 大規模テストコレクションを使用し,リンク構造をはじめとするWebの特徴を考慮して,検索や分類などの情報アクセス手法を評価するための手法について検討している. 平成14年度は,数種の文書モデル,クエリモデル,ユーザモデルを組み合わせることにより,Web情報検索の評価モデルを設計した.さらに,それらに基づき,種々の手法を用いたサーチエンジンの有効性について,テストコレクションを用いた比較評価を行った.その結果,簡潔で曖昧性を含むクエリを使用し,上位10件程度の検索結果のみを閲覧することを前提とした評価モデルにおいてはリンク構造解析を用いたサーチエンジンが有効であり,それ以外の評価モデルではサーチエンジンにおいてリンク構造が考慮されていてもそれほどの効果は現れないことを検証した.
|