近年情報が爆発的に増加しており、膨大な情報源から真に必要とする情報を如何に抽出するかは、極めて深刻な課題であり、本研究では当該課題に挑戦すし、情報源の中でも最も増加率の高いウェブ情報源に対して定量的評価基盤を構築することを目的とする。即ち、情報獲得に関して種々の研究がなされているが、ウェブでは刻々とコンテンツが変化することから、それらの成果を再現性のある形で定量的に示すことは不可能であった。本研究では、各種手法の有効性を定量的かつ再現性を持たせた形で評価するプラットフォームを構築する。具体的には、既に独自に開発した超高速クローラ(ウェブページ収集システム)を改良し、細粒度時系列差分スナップショットを取得し各種テキストインデクス、種々のリンクインデクス等を実装した高度プラットフォームを構築する。
|