去年は2つのトピックについて研究を行った: a)ウェブ上の新鮮な情報を検索するための新しいメソッドの開発。 b)ウェブ上の未来に関連する情報の抽出と解析。 1つ目のトピックについては、ユーザクエリに適合したウェブ上の新鮮な情報を獲得するために2つの手法を提案した。1つ目の提案手法においては同じクエリに対してウェブページとニュースのコンテンツの比較を行った。ニュースコンテンツではユーザのクエリに関係ある重要な出来事を発見するためにクラスタリングを行った。 2つ目の提案手法ではサーチインターフェースをマイニングすることで最新の情報を発見している。対象のクエリに結合されている最新の表現(例えば、「最近」、「最新」)を含む単語と、過去に関連する表現(例えば、「古い」、「アーカイブ」、「2005年」)を含む単語をサーチエンジンに送信し、検索結果を解析した。次に、その検索結果の比較を行った。これにより、最新の単語と過去の単語の分別が可能になった。 2つ目のトピックでは、将来に関連する情報を効果的に獲得するために、ウェブ上の過去に関連する情報の取得と解析を行った。提案手法では特別なクエリを作成することで新鮮度の高い可能性のある情報をまず取得し、次に得られた情報のフィルタリングと解析を行うことで実際に将来と関係のない情報や過去についての予測を獲得している。 加えて、将来に関連する情報の分布を解析している。更に、人々がウェブ上に記載する典型的な将来に関連するトピックスについても引き出している。
|