2003 Fiscal Year Annual Research Report
Web情報管理を目的とした情報検索とWebマイニングに関する研究
Project/Area Number |
14780339
|
Research Institution | National Institute of Informatics |
Principal Investigator |
江口 浩二 国立情報学研究所, 人間・社会情報研究系, 助手 (50321576)
|
Keywords | 情報検索 / 文書クラスタリング / オンライン・クラスタリング / 評価モデル / テストコレクション / サーチエンジン / リンク構造解析 / ハイパーテキスト |
Research Abstract |
平成15年度は,主として下記の研究を行った. 1.Web情報検索システムの評価モデリング Web情報検索手法の有効性を評価するため,大規模テストコレクションを使用し,リンク構造をはじめとするWebの特徴を考慮した評価モデルについて検討を行った.数種の文書モデル,クエリモデル,ユーザモデルを組み合わせることにより,Web情報検索の評価モデルを設計した.それらに基づき,種々の手法を用いたサーチエンジンの有効性について,テストコレクションを用いた比較評価を行った.その結果,簡潔で曖昧性を含むクエリを使用し,上位10件程度の検索結果のみを閲覧することを前提とした評価モデルにおいてはリンク構造解析を用いたサーチエンジンが有効であることを検証した.さらに,クエリの曖昧性や多様性が有効性に与える影響について検討を行った. 2.オンライン・クラスタリングとその評価モデリング 利用者が入力する検索質間に対する検索結果を高精度に分類し,利用者のブラウジングにおける認知的負荷を軽減することを目的とした技術に焦点を当て,特にWebページの話題に基づく分類に着目して技術的戦略ならびに評価モデルを検討した.このとき,前提とする場面として,(1)利用者が明確な検索要求を抱いて検索結果をブラウジングする場合と,(2)利用者が明確な検索要求を持たずに検索を実行しその検索結果をブラウジングする場合の2種類の利用モデルを想定し,それぞれに適した評価モデルを提案し,実際に数種の手法に対して評価を実施した.
|
-
[Publications] Koji Eguchi: "Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure"IEICE Transactions on Information and Systems. Vol.E86-D, No.9. 1804-1813 (2003)
-
[Publications] Koji Eguchi: "System Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure"The 12th International World Wide Web Conference (WWW2003). No.poster-344. 1-2 (2003)
-
[Publications] 栗山和子: "大規模テストコレクション構築のためのプーリング:NTCIR-3言語横断検索タスクの分析"情報処理学会研究報告. No.2003-FI-72. 91-98 (2004)
-
[Publications] 栗山和子: "NTCIR-3言語横断検索タスクの分析:プーリングを中心として"情報処理学会研究報告. No.2003-FI-73. 9-16 (2004)
-
[Publications] 中山記男: "感情語の色表現を用いた文書クラスタリング"電子情報通信学会第15回データ工学ワークショップ(DEWS2004). No.I-7-2. 1-4 (2004)
-
[Publications] 中山記男: "印象によるWebページのクラスタリング"情報処理学会第66回全国大会講演論文集. Vol.3, No.2U-2. 89-90 (2004)