2001 Fiscal Year Annual Research Report
Webマイニング技術を用いたピアツーピア情報フィルタリング
Project/Area Number |
13224053
|
Research Institution | Kyoto University |
Principal Investigator |
河野 浩之 京都大学, 大学院・情報学研究科, 助教授 (70224813)
|
Co-Investigator(Kenkyū-buntansha) |
川原 稔 京都大学, 大型計算機センター, 助手 (50224829)
|
Keywords | Webマイニング / テキストマイニング / 検索エンジン / ピアツーピアネットワーク / 情報フィルタリング / 分類 / 抽出 / 相関ルール |
Research Abstract |
Gnutellaのようなピュア型のP2Pシステムの分散検索性能を向上させるために「Webマイニング技術を用いたピアツーピア情報フィルタリング」に関する基礎研究を行った.なお,研究者らが,これまでに行った研究内容は,「Webマイニングアルゴリズムの研究開発」と「P2P除法フィルタリング手法の研究開発」に分けることができる.そして,研究者らが1995年以後行ってきたWeb検索エンジン「問答」と直接関連する前者の研究を踏まえて,新たなプラットホームであるP2Pネットワーク上のリソースに適用する後者の研究を遂行した. 1.Webマイニングアルゴリズムの研究開発の成果 XMLなどの半構造データのメタ情報を活用したクラスタリングアルゴリズムや相関ルール導出アルゴリズムを基礎に,P2P環境下でより分散して配置される情報資源に利用可能なマイニング技術を視野に入れた研究を行った.処理データとして,Webページのハイパーリンクのアンカー情報を利用した. 2.P2P情報フィルタリング手法の研究開発の成果 P2Pクライアントに蓄積された情報資源に対し,データマイニング技術を用いたフィルタリング手法を提案した.特に,情報資源の効率的選択を支援するために,検索ユーザのプリファレンスとコンテンツの情報ベクトルを利用した指標の開発を,分類子・抽出子の技術を基礎に研究を進めた. 上記に関わる研究報告を,情報処理学会知能と複雑系研究会,ならびに,情報処理学会データベースシステム研究会の「データベースとWeb情報システムに関するシンポジウム(DBWeb2001)」において行った.
|
Research Products
(7 results)
-
[Publications] 野村賢, 河野 浩之, 川原稔: "ROC距離に基づく先読み検索手法の提案と性能評価"情報処理学会論文誌:データベース. 42,TOD10. 56-65 (2001)
-
[Publications] 河野 浩之, 川原稔: "Web検索におけるテキストマイニング"人工知能学会誌. 16,2. 212-219 (2001)
-
[Publications] 那須川哲哉, 河野 浩之, 有村博紀: "テキストマイニング基盤技術"人工知能学会誌. 16,2. 201-211 (2001)
-
[Publications] 中辻 真, 川原稔, 河野浩之: "ピアツーピアネットワークにおけるトピック主導型検索手法の提案"知能と複雑系研究会. 124. 47-54 (2001)
-
[Publications] 中辻真, 川原稔, 河野浩之: "ピアツーピアネットワーク上のトピック主導型検索システムとインデックス技術"データベースとWeb情報システムに関するシンポジウム. No.17. 217-224 (2001)
-
[Publications] Kawahara, M., Kawano, H.: "Mining Association Algorithm with Improved Threshold Based on ROC Analysis"Proc.of 2001 IEEE Pacific Rim Conference (PACRIM'01). Vol.2. 703-706 (2001)
-
[Publications] 河野浩之, 山田誠二, 北村泰彦, 高橋克巳: "情報検索とエージェント"東京電機大学出版局. 131 (2002)