2002 Fiscal Year Annual Research Report
Web情報管理を目的とした情報検索とWebマイニングに関する研究
Project/Area Number |
14780339
|
Research Institution | National Institute of Informatics |
Principal Investigator |
江口 浩二 国立情報学研究所, 人間・社会情報研究系, 助手 (50321576)
|
Keywords | 情報検索 / 情報管理 / Webマイニング / 評価手法 / テストコレクション / サーチエンジン / リンク構造解析 / ハイパーテキスト |
Research Abstract |
平成14年度は,主として下記の研究を行った. 1.アンカーテキストに基づく検索手法 大規模なWeb情報を対象にした組織化・構造化の手法,並びに検索や分類などの情報アクセス手法について検討している. 平成14年度は,Webページに含まれるアンカーテキストに着目した検索手法について検討した.その実現可能性について大規模テストコレクションを用いて吟味したところ,アンカーテキストに基づく当該手法は主題検索には必ずしも有効でないことを示唆する結果が観察された.既知事項検索などに適用した場合の有効性について,さらなる検討の必要性が明らかになった. 2.Web情報アクセスシステムの評価手法 大規模テストコレクションを使用し,リンク構造をはじめとするWebの特徴を考慮して,検索や分類などの情報アクセス手法を評価するための手法について検討している. 平成14年度は,数種の文書モデル,クエリモデル,ユーザモデルを組み合わせることにより,Web情報検索の評価モデルを設計した.さらに,それらに基づき,種々の手法を用いたサーチエンジンの有効性について,テストコレクションを用いた比較評価を行った.その結果,簡潔で曖昧性を含むクエリを使用し,上位10件程度の検索結果のみを閲覧することを前提とした評価モデルにおいてはリンク構造解析を用いたサーチエンジンが有効であり,それ以外の評価モデルではサーチエンジンにおいてリンク構造が考慮されていてもそれほどの効果は現れないことを検証した.
|
-
[Publications] 江口 浩二: "Web検索のための評価ワークショップに適したシステム評価方法"日本データベース学会Letters. Vol.1,No.2. 40-43 (2003)
-
[Publications] Koji Eguchi: "Sensitivity of IR Systems Evaluation to Topic Difficulty"Proceedings of the 3rd International Conference on Language Resources and Evaluation. Vol.2. 585-589 (2002)
-
[Publications] Koji Eguchi: "The Web Retrieval Task and its Evaluation in the Third NTCIR Workshop"Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 375-376 (2002)
-
[Publications] Koji Eguchi: "Evaluation Design of Web Retrieval Task in the Third NTCIR Workshop"The 11th International World Wide Web Conference. No.poster-22. 1-2 (2002)
-
[Publications] Koji Eguchi: "Evaluation Methods for Web Retrieval Tasks"Proceedings of DBWeb2002. 415-422 (2002)
-
[Publications] Koji Eguchi: "Overview of the Web Retrieval Task at the Third NTCIR Workshop"Proceedings of the Third NTCIR Workshop on Research in Information Retrieval, Automatic Text Summarization and Question Answering. 1-26 (2003)
-
[Publications] 江口 浩二: "リンク関係と重複ページを考慮したWeb検索システムの評価方法"情報アクセスのためのテキスト処理シンポジウム発表論文集. 9-16 (2003)
-
[Publications] Koji Eguchi: "Overview of the Web Retrieval Task at the Third NTCIR Workshop"NII Technical Report. No.NII-2003-002E. 1-29 (2003)