研究概要 |
Gnutellaのようなピュア型のP2Pシステムの分散検索性能を向上させるために「Webマイニング技術を用いたピアツーピア情報フィルタリング」に関する基礎研究を行った.なお,研究者らが,これまでに行った研究内容は,「Webマイニングアルゴリズムの研究開発」と「P2P除法フィルタリング手法の研究開発」に分けることができる.そして,研究者らが1995年以後行ってきたWeb検索エンジン「問答」と直接関連する前者の研究を踏まえて,新たなプラットホームであるP2Pネットワーク上のリソースに適用する後者の研究を遂行した. 1.Webマイニングアルゴリズムの研究開発の成果 XMLなどの半構造データのメタ情報を活用したクラスタリングアルゴリズムや相関ルール導出アルゴリズムを基礎に,P2P環境下でより分散して配置される情報資源に利用可能なマイニング技術を視野に入れた研究を行った.処理データとして,Webページのハイパーリンクのアンカー情報を利用した. 2.P2P情報フィルタリング手法の研究開発の成果 P2Pクライアントに蓄積された情報資源に対し,データマイニング技術を用いたフィルタリング手法を提案した.特に,情報資源の効率的選択を支援するために,検索ユーザのプリファレンスとコンテンツの情報ベクトルを利用した指標の開発を,分類子・抽出子の技術を基礎に研究を進めた. 上記に関わる研究報告を,情報処理学会知能と複雑系研究会,ならびに,情報処理学会データベースシステム研究会の「データベースとWeb情報システムに関するシンポジウム(DBWeb2001)」において行った.
|