1998 Fiscal Year Annual Research Report
半構造データを扱う情報システム統合のためのデータマイニング技術に関する研究
Project/Area Number |
10780259
|
Research Institution | Kyoto University |
Principal Investigator |
河野 浩之 京都大学, 情報学研究科, 助教授 (70224813)
|
Keywords | データマイニング / テキストマイニング / データベースからの知識発見 / サーチエンンジン / 全文検索システム / 相関ルール / 性能評価 / 文書検索システム |
Research Abstract |
初年度は,Web文書を中心とした半構造データにおけるリンク情報などの特性に関する研究を行った. 1. 半構造データに対するデータマイニングアルゴリズムの研究 主要なデータマイニングアルゴリズムの比較を行ない,半構造データがらルール導出が可能なアルゴリズムを検討した.また,提案したアルゴリズムにおいて利用する閾値に関するルールの性能特性を明らかにした. 2. ネットワーク上からの半構造データの収集 ネットワーク上からの半構造データ収集を他機関と共に分散収集型ロボットを利用して試み,大容量ハードディスクへと格納した.なお,基本的なシステム構成法について,関連する機関から国際会議における発表を行なった. 3.提案したアルゴリズムの実装 我々の開発している検索システム「問答」の機能拡張を行いながら,提案したアルゴリズムの実装を今年度予算で導入した機器上で行った. 4. 収集した半構造データに対するアルゴリズム適用実験 半構造データを格納して,導出されるルールが単一の情報システムの検索支援において有効であるかどうかの検証を行った.
|
-
[Publications] 河野 浩之: "データウェアハウスとデータマイニングの概要" オペレーションズ・リサーチ. 43. 647-652 (1998)
-
[Publications] Jiawei Han: "Generalization-based Data Mining in Object-oriented Databases Using an Object Cube Model" Data and Knowledge Engineering. 25. 55-97 (1998)
-
[Publications] Minoru Kawahara: "Implementation of Bibliographic Navigation Systems with Text Data Mining" Systems Science. 24. (1998)
-
[Publications] 川原稔: "文献データベース情報検索に対するデータマイニング技術の適用" 情報処理学会論文誌. 39. 878-887 (1998)
-
[Publications] 川原 稔: "相関ルール実体化を行う文献情報検索支援システムの性能評価" 電子情報通信学会論文誌. J82-DI. 165-173 (1999)
-
[Publications] Hayato Yamana: "Experiments of Collecting WWW Information using Distributed WWW Robots" Proc.of SIGIR'98. 379-380 (1998)