• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

参照の同一性判定に基づく複数Webページの検索閲覧方式の研究

Research Project

Project/Area Number 16700097
Research InstitutionKyoto University

Principal Investigator

小山 聡  京都大学, 情報学研究科, 助手 (30346100)

KeywordsWeb検索 / オブジェクト識別 / クラスタリング / 情報抽出 / 文書構造 / 類似度 / 文脈依存検索 / Web閲覧インタフェース
Research Abstract

Webでは,人物や商店といった実世界の単一のオブジェクトに対して,複数のページに記述がある場合や,複数の異なるオブジェクトが同じ名前で参照される場合がある.検索精度の向上のためには,参照の曖昧性を解消する一種の「名寄せ」の方式の開発が必要となる.これはオブジェクト識別問題と呼ばれ,重要な例としてWebに現れる同姓同名人物の識別問題が存在する.Webにおいては,予め全てのページに対してオブジェクト識別を行っておくことは処理時間やスケーラビリティの点から現実的ではなく,人名を入力とした検索結果を,ページ間の類似度に従ってその場でクラスタリングする方式が有効である.クラスタリングは,データの特徴ベクトルとしての表現,、データ間の類似度の定義,クラスタリング指標といった構成要素からなり,それぞれの要素に異なる手法が存在する.そこで我々は,クラスタリングにおける様々な構成要素の組合せに対して,実際のWebの検索結果を対象とした実験を行い,手法の比較と分析を行った.さらに,実験結果に基づき,Webにおける人物の識別精度を向上させるための方式の提案を行った.1つは,Webページからのプロファイル抽出を用いる方式であり,ルールによって抽出された人物のプロファイルに関連する語を特徴ベクトルにおいて重視する.もう1つは,Webの構造情報を用いる方式であり,ページ内で人名が含まれる段落と他の語とが含まれる段落との階層関係およびWebページ間のURLの類似度を考慮して,特徴ベクトルの重み付けを行う.評価実験の結果,提案手法により,識別精度が大きく改善されることが確認された.さらに,ユーザの文脈を考慮し質問修正と再ランキングを行うことで参照の曖昧性を解消する方式,複数Webページの比較閲覧を行うためのアルゴリズムとインタフェースの開発等を行った.

  • Research Products

    (7 results)

All 2006 2005

All Journal Article (7 results)

  • [Journal Article] Context Matcher : Improved Web Search Using Query Term Context in Source Document and in Search Results2006

    • Author(s)
      Takahiro Kawashige, Satoshi Oyama, Hiroaki Ohshima, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Computer Science (Proceedings of the 8th Asia Pacific Web Conference (APWeb2006)) Vol.3841

      Pages: 486-497

  • [Journal Article] Webの構造情報とプロファイル抽出を用いたオブジェクト識別2006

    • Author(s)
      白砂 健一, 小山 聡, 田島 敬史, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

  • [Journal Article] レビューページ例からの属性抽出に基づくレビューページ検索2006

    • Author(s)
      赤木 法生, 大島 裕明, 小山 聡, 田島 敬史, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

  • [Journal Article] 質問修正と再ランキングを用いた文脈依存Web検索2006

    • Author(s)
      河重 貴洋, 小山 聡, 大島 裕明, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

  • [Journal Article] 複数Webサイトからの共通側面の抽出と類似サイト検索2006

    • Author(s)
      小谷 彬, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

  • [Journal Article] 文書群をクエリとした似て非なる文書の検索2006

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

  • [Journal Article] 複数Webコンテンツの多面的閲覧のための空間インタフェース2005

    • Author(s)
      小谷 彬, 小山 聡, 田中 克己
    • Journal Title

      日本データベース学会Letters Vol.4,No.1

      Pages: 161-164

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi