• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Web情報管理を目的とした情報検索とWebマイニングに関する研究

研究課題

研究課題/領域番号 14780339
研究種目

若手研究(B)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関国立情報学研究所

研究代表者

江口 浩二  国立情報学研究所, 人間・社会情報研究系, 助手 (50321576)

研究期間 (年度) 2002 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2004年度: 1,000千円 (直接経費: 1,000千円)
2003年度: 1,100千円 (直接経費: 1,100千円)
2002年度: 1,200千円 (直接経費: 1,200千円)
キーワード情報検索 / 文書クラスタリング / 評価モデル / テストコレクション / サーチエンジン / リンク構造解析 / ハイパーテキスト / オンライン・クラスタリング / 情報管理 / Webマイニング / 評価手法
研究概要

平成16年度は,主として下記の研究を行った.
1.Web情報検索システムの評価モデリング
Web情報検索手法の有効性を評価するため,大規模テストコレクションを使用し,リンク構造をはじめとするWebの特徴を考慮した評価モデルについて検討を行った.数種の文書モデル,クエリモデル,ユーザモデルを組み合わせることにより,Web情報検索の評価モデルを設計した.それらに基づき,種々の手法を用いたサーチエンジンの有効性について,共通のテストコレクションを用いた比較評価を行った.その結果,例えば,簡潔で曖昧性を含むクエリを使用し,上位10件程度の検索結果のみを閲覧することを前提とした評価モデルにおいて,リンク構造解析を用いたサーチエンジンが有効であることを検証した.さらに,クエリの曖昧性や多様性が有効性に与える影響について検討を行った.
2.Web情報検索タスクに適した文書クラスタリング手法とその評価モデリング
利用者が入力する検索質問に対する検索結果を高精度に分類し,利用者のブラウジングにおける認知的負荷を軽減することを目的とした技術に焦点を当て,特にWebページの話題に基づいた分類に着目して技術的戦略ならびに評価モデルを検討した.このとき,前提とする場面として,(1)利用者が明確な検索要求を抱いて検索結果をブラウジングする場合と,(2)利用者が明確な検索要求を持たずに検索を実行しその検索結果をブラウジングする場合の2種類の利用モデルを想定し,それぞれに適した評価モデルを提案し,実際に数種の文書クラスタリング手法に対して共通のテストコレクションに基づいた評価を実施し,比較検討を行った.

報告書

(3件)
  • 2004 実績報告書
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (23件)

すべて 2005 2004 その他

すべて 雑誌論文 (9件) 文献書誌 (14件)

  • [雑誌論文] 感情表現のモデル2005

    • 著者名/発表者名
      中山記男
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Web情報アクセス技術の評価モデル2004

    • 著者名/発表者名
      江口浩二
    • 雑誌名

      情報の科学と技術 Vol.54, No.12

      ページ: 647-652

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Web検索の技術動向と評価手法2004

    • 著者名/発表者名
      江口浩二
    • 雑誌名

      情報処理(情報処理学会誌) Vol.45, No.6

      ページ: 569-573

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] An Evaluation of the Web Retrieval Task at the Third NTCIR Workshop2004

    • 著者名/発表者名
      Koji Eguchi
    • 雑誌名

      ACM SIGIR Forum Vol.38, No.1

      ページ: 39-45

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] テキスト処理に基づくWeb情報アクセス支援 -検索から分類・追跡へ-2004

    • 著者名/発表者名
      江口浩二
    • 雑誌名

      第3回情報科学技術フォーラム特別企画「WEB知的処理の基礎」

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Overview of WEB Task at the Fourth NTCIR Workshop2004

    • 著者名/発表者名
      Koji Eguchi
    • 雑誌名

      Proceedings of the Fourth NTCIR Workshop on Research in Information Access Technologies : Information Retrieval, Question Answering and Summarization

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Overview of the Informational Retrieval Task at NTCIR-4 WEB2004

    • 著者名/発表者名
      Koji Eguchi
    • 雑誌名

      Proceedings of the Fourth NTCIR Workshop on Research in Information Access Technologies : Information Retrieval, Question Answering and Summarization

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Overview of the Topical Classification Task at NTCIR-4 WEB2004

    • 著者名/発表者名
      Koji Eguchi
    • 雑誌名

      Proceedings of the Fourth NTCIR Workshop on Research in Information Access Technologies : Information Retrieval, Question Answering and Summarization

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 感情表現の抽出手法に関する提案2004

    • 著者名/発表者名
      中山記男
    • 雑誌名

      情報処理学会研究報告 Vol.2004, No.108

      ページ: 13-18

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] Koji Eguchi: "Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure"IEICE Transactions on Information and Systems. Vol.E86-D, No.9. 1804-1813 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Koji Eguchi: "System Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure"The 12th International World Wide Web Conference (WWW2003). No.poster-344. 1-2 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 栗山和子: "大規模テストコレクション構築のためのプーリング:NTCIR-3言語横断検索タスクの分析"情報処理学会研究報告. No.2003-FI-72. 91-98 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 栗山和子: "NTCIR-3言語横断検索タスクの分析:プーリングを中心として"情報処理学会研究報告. No.2003-FI-73. 9-16 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 中山記男: "感情語の色表現を用いた文書クラスタリング"電子情報通信学会第15回データ工学ワークショップ(DEWS2004). No.I-7-2. 1-4 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 中山記男: "印象によるWebページのクラスタリング"情報処理学会第66回全国大会講演論文集. Vol.3, No.2U-2. 89-90 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 江口 浩二: "Web検索のための評価ワークショップに適したシステム評価方法"日本データベース学会Letters. Vol.1,No.2. 40-43 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Koji Eguchi: "Sensitivity of IR Systems Evaluation to Topic Difficulty"Proceedings of the 3rd International Conference on Language Resources and Evaluation. Vol.2. 585-589 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Koji Eguchi: "The Web Retrieval Task and its Evaluation in the Third NTCIR Workshop"Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 375-376 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Koji Eguchi: "Evaluation Design of Web Retrieval Task in the Third NTCIR Workshop"The 11th International World Wide Web Conference. No.poster-22. 1-2 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Koji Eguchi: "Evaluation Methods for Web Retrieval Tasks"Proceedings of DBWeb2002. 415-422 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Koji Eguchi: "Overview of the Web Retrieval Task at the Third NTCIR Workshop"Proceedings of the Third NTCIR Workshop on Research in Information Retrieval, Automatic Text Summarization and Question Answering. 1-26 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 江口 浩二: "リンク関係と重複ページを考慮したWeb検索システムの評価方法"情報アクセスのためのテキスト処理シンポジウム発表論文集. 9-16 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Koji Eguchi: "Overview of the Web Retrieval Task at the Third NTCIR Workshop"NII Technical Report. No.NII-2003-002E. 1-29 (2003)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi