研究分担者 |
石川 佳治 筑波大学, 大学院・システム情報工学研究科, 助教授 (80263440)
天笠 俊之 筑波大学, 大学院・システム情報工学研究科, 講師 (70314531)
庄司 功 筑波大学, 大学院システム情報工学研究科, 教授 (20282329)
森嶋 厚行 筑波大学, 図書館情報メディア研究科, 助教授 (70338309)
|
研究概要 |
近年のインターネット技術の急速な進展により,様々な情報提供サイトが利用可能となっている.これらの中には,Webページ生成プログラム等を用いて動的に内包データを提供する情報生成型サイトや,連続的に新しい情報を提供する時系列ストリーム型サイトがある.本研究では,インターネット環境における動的情報提供サイトからの高精度な情報獲得と利用者に優しい操作環境の実現を目的として,知識発見・学習機能を用いた情報獲得手法に関する研究を推進している. 今年度は主に以下の項目に関する基盤技術の研究開発を行った. 1.データベース中のデータを用いて特定分野のWeb情報を獲得する手法について研究を推進した.特に,Webからの知識抽出とデータクリーニングを組み合わせた手法を開発した. 2.サイトプロファイリングに利用可能な知識発見手法として,異常値の検出手法(特に高次元データを対象とした手法)を開発した. 3.同様にサイトプロファイリングに利用可能な知識発見手法として,データ間の比率相関性の検出手法やクラスタ分析手法を開発した. 4.blog等の時系列テキストから主要なトピックを抽出する手法を行う手法を開発した. 5.固有表現に着目したテキストのクラスタ分析手法を開発した. 6.P2P環境等の分散環境において,プロファイル情報を共有するための基盤技術を開発した. 7.実世界の情報提供サイトに含まれるノイズを考慮した相関ルールマイニング手法を開発した. 8.各種情報源から提供されるデータをXMLにラッピングして操作することを想定し,分散・並列処理環境においてXMLデータの効率的検索を行う手法を開発した.
|