研究概要 |
初年度は,以下の2点から,Webマイニング技術を用いた分散協調型情報フィルタリング機構に関する研究を進めた. 1.半構造データに対するマイニングアルゴリズムのWebデータヘの適用 協調型情報フィルタリング機構を実現するために,これまでのデータマイニングの研究を発展させ,蓄積したWebデータの特性を詳細に検討し,Webデータ構造の特性を利用したマイニングアルゴリズムを提案した.特に,ハイパーリンクのグラフ構造以外に注目し,HTML, SGML, XMLに付随する各種タグ情報を利用した分類アルゴリズムを提案し,その性能評価を行った. なお,Webデータの統計処理,アルゴリズムの実装,及び,性能評価のために,10G程度のWebページ集合を用いた. 2.情報フィルタリング機構実装のための基礎データ処理 1で提案したアルゴリズムを,情報可視化インタフェースを備えた「問答」検索システムによって検索するために収集データのインデックス生成をOpen Text全文検索データベースシステムにより行った.さらに,「問答」検索システムの利用履歴を用いて,個々の利用者が、情報検索をどのような手順で進めるかの分析を行った.
|