2001 Fiscal Year Annual Research Report
Webの意味構造発見に基づく新しいWeb検索サービス方式に関する研究
Project/Area Number |
13224054
|
Research Institution | Kyoto University |
Principal Investigator |
田中 克己 京都大学, 情報学研究科, 教授 (00127375)
|
Keywords | World Wide Web / 情報検索 / 半構造データ / 汎化関連 / 集約関連 / ローカル度 / ブックマーク / 文脈 |
Research Abstract |
1.半構造データ間の差異構造の発見と比較情報サービス Webページは半構造データである.本研究では,検索されたWebページ群に内在する特徴的な差異構造を自動的に抽出する方式を開発した.具体的には,同種の内容を有する複数のWebページをボトムアップに比較し,差異構造をもとにした半構造データの共通スキーマを生成するボトムアップ型データガイドアルゴリズムを考案した.このような差異構造を自動抽出することで,例えば,商品情報の自動比較サービス等の新しい情報検索サービスの提供の可能性が考えられる. 2.Webページ間のis-a(汎化)関連およびpart-of(集約)関連の発見と活用 あるWebページと,より簡略化(または,詳細化/特殊化)した内容を持つページの間には,汎化関連があると考え,このような汎化関連を発見する手法を開発した.また,あるWebページの内容が,別のWebページの内容の1部になっている場合,これらのWebページ間には集約関連があると考え,このような集約関連を発見する手法も開発した.具体的には,このような意味的関連をWebデータ群から話題構造や特徴ベクトルを自動的に抽出・比較するアルゴリズムを考案した.これにより,Webデータ群の概念構造に基づく自動分類,詳細度や話題の包含関係といった新たな絞り込み検索を実現することができ,従来の検索エンジンに無い,新しい検索サービスを提供できる可能性が示せた. 3.Webページのローカル度計算と情報フィルタリングへの活用 Web情報の内容がどの程度地域的に限定された内容であるかどうかを測る尺度としてのローカル度といった概念を定義し,これらの計算アルゴリズムを開発した.具体的には,地理的用語の出現頻度,詳細度,緯度経度などをもとに推定するもので,これにより,地域性によるWeb情報のフィルタリングが行える可能性が示せた. 4.文脈依存型ブックマークの共有によるWeb情報検索 URLの単純な記憶という従来のブックマークではなく,検索過程で閲覧した他のURL群や閲覧結果に対するユーザの反応を文脈と解釈し,文脈に該当するページ群の特徴量やユーザの反応を,ブックマークとして登録したURLの属性情報として記憶し,これを複数ユーザで共有する方式を開発した.
|
Research Products
(6 results)
-
[Publications] 灘本明代: "携帯環境のためのWeb検索結果の動的再構成と受動的視聴"情報処理学会論文誌:データベース. 42・SIG15(TOD12). 1-13 (2001)
-
[Publications] 宮崎慎也: "WebSCAN : Webサイトの変更発見と放送型変更通知"情報処理学会論文誌:データベース. 42・SIG8(TOD10). 96-107 (2001)
-
[Publications] Takeshi Matsukura: "Discovery of Semantic Relationships among Web Pages Based on Web Topic Structures"Proceedings of the 9th IFIP 2.6 Working Conference on Database Semantics (DS-59). 184-199 (2001)
-
[Publications] Shinsuke Nakajima: "Context-Dependent Information Exploration"Proceedings of the International World Wide Web Conference (WWW2002). (掲載予定). (2002)
-
[Publications] Yoshihiro Nakanishi: "Modeling and Structuring Multiple Perspective Video for Browsing"Proceedings of the International Conference on Conceptual Modeling (ER2001). 485-498 (2001)
-
[Publications] 松本千弥子: "Webページの地理情報と話題の日常性を考慮したローカル度検出とフィルタリング機構"情報処理学会DBWeb2001シンポジウム論文集. 193-200 (2001)