研究概要 |
従来,Web文書の検索結果の順位はPageRankを代表として,「Web文書の被リンク数」や「Web文書内でのタグ構造の正当性,あらわれる単語等の情報」から,客観的かつ機械的に決定されている.しかしながら,自身のWeb文書の順位を少しでも上げるべく,検索エンジン最適化の取り組みが活発化しており,ユーザが真に必要とする情報へ辿り着くことが容易とは言えない状況になっている.本研究は,ユーザが真に必要とする情報をGoogleを代表とする従来の検索エンジンよりも容易に得られることを目指している.そこで本研究ではWeb2.0の知見を生かし,従来手法の客観的かつ機械的な順位付けへ各Web文書の主観的な評価値を融合することに取り組んでいる. 平成21年度は、「SlothLibを用いた試作システム」の開発を進めた.検索結果のランキングは、客観的かつ機械的な評価の上に主観的評価を融合する部分をかぶせる形で実装している.試作システムは、間もなく完成予定である. 一方で問題となるのが,検索結果として出現し評価値を付与されたWeb文書が,後続の検索においてどの程度再登場し利用され得るかである.一般に,他人であっても興味,検索ニーズが重複する可能性は,低いとは言えない.そこで,同一の検索タスクという単純化を行なった上で,異なるユーザ間で検索結果のWeb文書がどの程度重複するのかの調査を行なった.そして,同一の検索タスクに対して,どのようなクエリを与えるかは人によって異なるが、ユーザは同一のWeb文書に引き寄せられる傾向があるとの結果が得られた.これにより、評価値が付与されたWeb文書が再度登場する可能性は低いとは言えないとの結論が得られた.
|