2002 Fiscal Year Annual Research Report
Project/Area Number |
02F00115
|
Research Institution | Kyoto University |
Principal Investigator |
上林 弥彦 京都大学, 情報学研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
CHENG KAI 京都大学, 情報学研究科, 外国人特別研究員
|
Keywords | ウェブウェアハウス / トラフィック分析 / プロキシログ / 利用履歴 / コンテンツ推薦 / 情報検索 / トップページ |
Research Abstract |
ウェブの急速な普及につれインターネットトラフィックが年に4倍の割で増えてきたが、ネットワーク帯域幅は年に50%しか増加してない。ネットワークボトルネックを解消するためにキャッシュがよく知られているが、どのように工夫しても60%位のデータは二度と使われないことが示せる。この効率向上のために、知的キャッシュ(二度と使われないデータはできるだけキャッシュしない)、データベース機能(キャッシュの中にあるデータを優先する)、推薦機能(興昧のありそうな内容を推薦する)などの機能を含むウェブウェアハウスシステムを開発してきた。 我々は「革新的データシステム」を目指しウェブウェアハウスの高度機能を研究しできた。利用状況を考慮したデータ管理技術として、キャッシュがよく知られているが、サイズやCPU速度などの制限で、キャッシュデータを十分に活用されていない。逆にデータシステムにおいてはデータの利用状況を考慮していないので、効率的情報管理が実現できない。それ故に我々はキャッシュ技術としての履歴情報の利用と、データベース技術としてのコンテンツの管理と検索を統合し「容量制限なしのウェブウェアハウスシステム(CBFWW)」の提案・設計・開発を行ってきた。さらに、CBFWWにおけるデータ管理モデルとして、利用状況を考慮した階層的Webデータモデルを提案した。これらの成果をまとめて発表した。 CBFWWの高度の機能を検証するため、我々は(1)プロキシログ解析に基づくトップページの抽出と検索システム(UTPS)と(2)プロキシサーバを用いた共有Visited Links機能(SVL)の実現ができた。まず、大規模ISP Kyoto I-netの保有するWebアクセスのトラフィックデータを解析しWebページの人気度を得ることができ、この利用者の人気度を検索エンジンに持ち込み、利用者にとって最も適切なページを結果リストの最初に出すことが実現できた。さらに利用者の重要視するWebページの抽出を試みた。特にWebブラウザを立ち上げたときに最初に現れるページ、いわゆる「トップページ、開始ページ」の性質に注目し、ISPの利用者集合のトップページを収集し、検索できるようにし、利用者の質の高い情報の共有が可能になると考えられる。ほかに利用者への有用Webページの推薦サービスとして、プロキシサーバによる共有Visited Links機能(SVL)を実現し利用状況データと情報データの統合による新しいデータシステムの有用性を示した。
|
Research Products
(6 results)
-
[Publications] Y.Kambayashi, K.Cheng: "Capacity Bound-free Web Warehouse"Proceedings of the First Biennial Conference on Innovative Data Systems Research (CIDR 2003), Asilomar, CA. 47-57 (2003)
-
[Publications] K.Cheng, Y.Kambayashi: "A Semantic Model for Hypertext Data Caching"Proceedings of the 21^<st> International Conference on Conceptual Modeling (ER 2002), Tampere, Finland, LNCS 2503. 276-290 (2002)
-
[Publications] 成 凱, 平野真太郎, 上林彌彦: "プロキシログ解析に基くトップページの抽出と検索"第14回データ工学ワークショップ(DEWS2003). (電子出版). (2003)
-
[Publications] 成 凱, 上林彌彦: "Webデータのセマンティックキャッシユ手法"情報処理学会研究報告. 2002・67. 383-390 (2002)
-
[Publications] 成凱, 平野真太郎, 李龍, 上林弥彦, 東郁雄: "活動データのマイニングによるデータ優先度の決定"FIT2002 一般論文 2002年6月. (2002)
-
[Publications] 張剣鋒, 成凱, 上林弥彦: "プロキシーキャッシュに基づく共有VisitedLink機構"FIT2002 一般論文 2002年6月. (2002)