研究概要 |
初年度は,Web文書を中心とした半構造データにおけるリンク情報などの特性に関する研究を行った. 1. 半構造データに対するデータマイニングアルゴリズムの研究 主要なデータマイニングアルゴリズムの比較を行ない,半構造データがらルール導出が可能なアルゴリズムを検討した.また,提案したアルゴリズムにおいて利用する閾値に関するルールの性能特性を明らかにした. 2. ネットワーク上からの半構造データの収集 ネットワーク上からの半構造データ収集を他機関と共に分散収集型ロボットを利用して試み,大容量ハードディスクへと格納した.なお,基本的なシステム構成法について,関連する機関から国際会議における発表を行なった. 3.提案したアルゴリズムの実装 我々の開発している検索システム「問答」の機能拡張を行いながら,提案したアルゴリズムの実装を今年度予算で導入した機器上で行った. 4. 収集した半構造データに対するアルゴリズム適用実験 半構造データを格納して,導出されるルールが単一の情報システムの検索支援において有効であるかどうかの検証を行った.
|