2001 Fiscal Year Annual Research Report
データマイニング技術を用いた分散協調型情報フィルタリング機構
Project/Area Number |
13680482
|
Research Institution | Kyoto University |
Principal Investigator |
河野 浩之 京都大学, 大学院・情報学研究科, 助教授 (70224813)
|
Co-Investigator(Kenkyū-buntansha) |
川原 稔 京都大学, 大型計算機センター, 助手 (50224829)
|
Keywords | データマイニング / 情報フィルタリング / Webマイニング / テキストマイニング / 半構造データ / 情報可視化 / 検索支援システム / ハイパーテキスト |
Research Abstract |
初年度は,以下の2点から,Webマイニング技術を用いた分散協調型情報フィルタリング機構に関する研究を進めた. 1.半構造データに対するマイニングアルゴリズムのWebデータヘの適用 協調型情報フィルタリング機構を実現するために,これまでのデータマイニングの研究を発展させ,蓄積したWebデータの特性を詳細に検討し,Webデータ構造の特性を利用したマイニングアルゴリズムを提案した.特に,ハイパーリンクのグラフ構造以外に注目し,HTML, SGML, XMLに付随する各種タグ情報を利用した分類アルゴリズムを提案し,その性能評価を行った. なお,Webデータの統計処理,アルゴリズムの実装,及び,性能評価のために,10G程度のWebページ集合を用いた. 2.情報フィルタリング機構実装のための基礎データ処理 1で提案したアルゴリズムを,情報可視化インタフェースを備えた「問答」検索システムによって検索するために収集データのインデックス生成をOpen Text全文検索データベースシステムにより行った.さらに,「問答」検索システムの利用履歴を用いて,個々の利用者が、情報検索をどのような手順で進めるかの分析を行った.
|
Research Products
(7 results)
-
[Publications] 野村賢, 河野 浩之, 川原稔: "ROC距離に基づく先読み検索手法の提案と性能評価"情報処理学論文誌:データベース. 42, TOD10. 56-65 (2001)
-
[Publications] 河野 浩之, 川原稔: "Web検索におけるテキストマイニング"人工知能学会誌. 16・2. 212-219 (2001)
-
[Publications] 那須川哲哉, 河野 浩之, 有村博紀: "テキストマイニング基盤技術"人工知能学会誌. 16・2. 201-211 (2001)
-
[Publications] 河野 浩之: "位置情報システムにおける空間データ利用に関する検討"人工知能学会FAI&KBS研究会. FAI-46, KBS-54. 159-164 (2001)
-
[Publications] 中辻真, 川原稔, 河野 浩之: "ピアツーピアネットワーク上のトピック主導型検索システムとインデックス技術"データベースとWeb情報システムに関するシンポジウム. 17. 217-224 (2001)
-
[Publications] Kawahara, M., Kawano, H.: "Mining Association Algorithm with Improved Threshold Based on ROC Analysis"Proc. of 2001 IEEE Pacific Rim Conference (PACRIM' 01). 2. 703-706 (2001)
-
[Publications] 河野浩之, 山田誠二, 北村泰彦, 高橋克巳: "情報検索とエージェント"東京電機大学出版局. 131 (2002)