• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

検索エンジンの信頼性解析

研究課題

研究課題/領域番号 21300038
研究機関早稲田大学

研究代表者

山名 早人  早稲田大学, 理工学術院, 教授 (40230502)

キーワード検索エンジン / 信頼性 / ランキング / 情報検索 / データマイニング
研究概要

研究目的
検索エンジンは各種活動に必要不可欠な存在であるが,ランキングや検索結果数が本当に信頼できるかといった信頼性については不明瞭な部分が多い.本研究ではこうした信頼性を明かにし,安心してインターネットを利用できる環境を提供することを目指す.
研究項目
2009年度は下記項目において研究を進めた.
(1)比較対象となるデータセット作成のための効率的な日本語Webページ収集手法
(2)Web検索のランキング解析・検索結果数の解析
(3)画像検索のランキング解析
(4)信頼性を判断するためのベンチマーク構築
研究成果
(1)では,アンカーテキスト記述言語に着目した効率的な収集手法を提案し,当該言語で記述されたWebページを効率的に収集可能(収集ページ中87%を当該言語で収集可能)であることを確認した.
(2)では,1万件のクエリ(検索語)を用いてGoogle,Yahoo!,Bingを対象に約2ヶ月間解析を行った.その結果,検索結果数は「検索のタイミング(短時間の繰り返し検索)」「検索結果の何ページ目を参照しているか」「検索日時(数日以上空けての検索)」によって変動することを確認し,「検索結果の最終ページを表示している場合で,かつ,1週間以上の間,検索結果数が安定している場合」に検索結果数の信頼性が高くなることを示した.
(3)では,2000件のクエリを用いてGoogle,Yahoo!,Bingを対象に約2ヶ月間解析を行った.その結果,検索エンジン間の検索画像の重複が2~8%と極めて低い点,及び,GoogleやBingは2ヶ月での変動が上位50件中30~20%であるが,Yahoo!は日によって半分以上の結果が更新されることを確認した.
(4)では,研究協力者のCho准教授,Menczer准教授とディスカションを行い,検索エンジンのアーキテクチャを前提としたベンチマークを構築するための検討を行った.

  • 研究成果

    (7件)

すべて 2010 2009

すべて 雑誌論文 (7件) (うち査読あり 1件)

  • [雑誌論文] 特定言語Webページ収集のためのフォーカストクローラの性能改善手法2010

    • 著者名/発表者名
      〓善斌, 山名早人
    • 雑誌名

      第2回データ工学と情報マネジメントに関するフォーラム論文集 B2-1

      ページ: 16

  • [雑誌論文] Hit Count Dance -検索エンジンのヒット数に関する信頼性検証-2010

    • 著者名/発表者名
      舟橋卓也, 山名早人
    • 雑誌名

      第2回データ工学と情報マネジメントに関するフォーラム論文集 B2-2

      ページ: 16

  • [雑誌論文] WWWにおけるP3Pコンパクトポリシーの利用状況に関する調査2010

    • 著者名/発表者名
      櫻井宏樹, 高木浩光, 山名早人
    • 雑誌名

      第2回データ工学と情報マネジメントに関するフォーラム論文集 D8-5

      ページ: 18

  • [雑誌論文] 複数キーワードクエリに対する検素ヒット数の信頼性検証2009

    • 著者名/発表者名
      舟橋卓也, 曽根広哲, 山名早人
    • 雑誌名

      信学技報 Vol.109, No.153

      ページ: 19-24

  • [雑誌論文] Ngram と離散型共起表現を用いたワードサラダスパム検出手法の提案2009

    • 著者名/発表者名
      森本浩介, 片瀬弘晶, 山名早人
    • 雑誌名

      情報研報 Vol.DBS-148.No.24

      ページ: 18

  • [雑誌論文] ウィキペディア記事閲覧回数の特徴分析2009

    • 著者名/発表者名
      曽根広哲, 山名早人
    • 雑誌名

      第21回セマンティックウェブとオントロジー研究会論文集 SIG-SWO-A901-03

      ページ: 15

  • [雑誌論文] Sensibility-aware image retrieval using computationally learned bases : RIM, JPG, J2K and their mxtures2009

    • 著者名/発表者名
      T.Kato, S.Horma, Y.Matsuyama, T.Yoshino, Y.Hoshino
    • 雑誌名

      Lecture Notes in Computer Science 5506

      ページ: 620-627

    • 査読あり

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi