Research Abstract |
1.半構造データ間の差異構造の発見と比較情報サービス Webページは半構造データである.本研究では,検索されたWebページ群に内在する特徴的な差異構造を自動的に抽出する方式を開発した.具体的には,同種の内容を有する複数のWebページをボトムアップに比較し,差異構造をもとにした半構造データの共通スキーマを生成するボトムアップ型データガイドアルゴリズムを考案した.このような差異構造を自動抽出することで,例えば,商品情報の自動比較サービス等の新しい情報検索サービスの提供の可能性が考えられる. 2.Webページ間のis-a(汎化)関連およびpart-of(集約)関連の発見と活用 あるWebページと,より簡略化(または,詳細化/特殊化)した内容を持つページの間には,汎化関連があると考え,このような汎化関連を発見する手法を開発した.また,あるWebページの内容が,別のWebページの内容の1部になっている場合,これらのWebページ間には集約関連があると考え,このような集約関連を発見する手法も開発した.具体的には,このような意味的関連をWebデータ群から話題構造や特徴ベクトルを自動的に抽出・比較するアルゴリズムを考案した.これにより,Webデータ群の概念構造に基づく自動分類,詳細度や話題の包含関係といった新たな絞り込み検索を実現することができ,従来の検索エンジンに無い,新しい検索サービスを提供できる可能性が示せた. 3.Webページのローカル度計算と情報フィルタリングへの活用 Web情報の内容がどの程度地域的に限定された内容であるかどうかを測る尺度としてのローカル度といった概念を定義し,これらの計算アルゴリズムを開発した.具体的には,地理的用語の出現頻度,詳細度,緯度経度などをもとに推定するもので,これにより,地域性によるWeb情報のフィルタリングが行える可能性が示せた. 4.文脈依存型ブックマークの共有によるWeb情報検索 URLの単純な記憶という従来のブックマークではなく,検索過程で閲覧した他のURL群や閲覧結果に対するユーザの反応を文脈と解釈し,文脈に該当するページ群の特徴量やユーザの反応を,ブックマークとして登録したURLの属性情報として記憶し,これを複数ユーザで共有する方式を開発した.
|