• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

新鮮な情報検索のためのスケーラブルな分散型サーチエンジン

Research Project

Project/Area Number 14780242
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field 計算機科学
Research InstitutionToyo University

Principal Investigator

上原 稔  東洋大学, 工学部, 助教授 (70256775)

Project Period (FY) 2002 – 2004
Project Status Completed (Fiscal Year 2004)
Budget Amount *help
¥2,900,000 (Direct Cost: ¥2,900,000)
Fiscal Year 2004: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2003: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2002: ¥1,200,000 (Direct Cost: ¥1,200,000)
Keywords情報検索 / サーチエンジン / 分散処理
Research Abstract

企業活動にITが使われる今日、Webページ検索はインターネットのみならずイントラネットでも重要な技術である。ビジネスでは特に新鮮な情報が必要とされている。しかし、既存の集中型サーチエンジンでは、文書収集に時間がかかり、十分に新鮮な情報を検索することが困難である。そこで、我々は分散型サーチエンジンを用いてこの間題を解決した。分散型サーチエンジンでは、文書を収集することなく各サイトでインデックスを作成する0このため、新鮮な情報の検索が可能となる。
しかし、分散型サーチエンジンは検索時に通信遅延が生じるため、規模を拡大することが困難であった。しかし、我々は、キャッシュを効率的に用いるいくつかの技法を開発した。「次の10件」検索では、先読みを行い、さらに上位10件を予測することで通信対象を選択する。この技法はANDおよびAND-NOTを含むクエリでは正しく予測することができない。この問題を、既検索クエリを投機的に再検索することで正しく予測する。この技法を永続的キャッシュと名づける。はじめて旨のクエリは、クエリの論理式に基づいてサイトを選択する。この技法をクエリに基づくサイト選択と名づける。これらの結果、規模にかぎらず一定の応答時間を実現した。また、システムの単一故障点となるメタサーバを多重化することで、システムの信頼性を著しく向上させることができた。
さらに、文書内容と鮮度の両方をランキングに反映したFTF・IDFスコアリング手法を提唱し、評価を行った。FTF・IDFは静的Word Spammingにも強い。
本研究に関して、平成16年度には、論文誌1件、国際会議5件、国内研究会ならびに学会発表1件の発表がなされた。

Report

(3 results)
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • Research Products

    (2 results)

All 2004 Other

All Journal Article (1 results) Publications (1 results)

  • [Journal Article] Scalability and Reliability in a Distributed Search Engine2004

    • Author(s)
      Nobuyoshi Sato
    • Journal Title

      Journal of Applied Systems Studies(JASS) 5・2

      Pages: 12-12

    • Related Report
      2004 Annual Research Report
  • [Publications] 酒井義文: "論理式における最小単調関数を変えない部分式の枝刈り"電子情報通信学会論文誌D-I. J86-6. 367-374 (2003)

    • Related Report
      2003 Annual Research Report

URL: 

Published: 2002-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi