1999 Fiscal Year Annual Research Report
半構造データを扱う情報システム統合のためのデータマイニング技術に関する研究
Project/Area Number |
10780259
|
Research Institution | Kyoto University |
Principal Investigator |
河野 浩之 京都大学, 大学院・情報学研究科, 助教授 (70224813)
|
Keywords | データマイニング / テキストマイニング / データベースからの知識発見 / サーチエンジン / 全文検索システム / 相関ルール / 性能評価 / 文書検索システム |
Research Abstract |
昨年度は,クラスタリングならびに相関ルールアルゴリズムなどの幾つかのデータマイニングアルゴリズムの性質の比較を行った.そして,ネットワーク上から収集したハイパーテキストデータに対するルール導出アルゴリズムを提案した.そこで,本年度は,昨年度の研究成果をふまえて,次の研究を行った. 1.提案したアルゴリズムの実装 我々の開発している検索システム「問答」の機能拡張を行いながら,提案したアルゴリズムの実装を,全文検索データベースOpenTextの機能を拡張することによって行った. 2.半構造データの収集とアルゴリズム適用実験 半構造データとしてハイパーテキストデータをOpenTextデータベースに格納し,拡張した相関ルール導出の有効性を検証した.また,「問答」の基本的なシステム構成法について国際会議で発表を行った. 3.ルール交換型プロトコルの構築 半構造データを格納したデータベースにおいて相関ルールを導入し,複数の情報システム間でルール交換を行うインターフェースを構築した.なお,そのルール交換機能は,Open TextのCGIを経由して実装した. 4.情報システム統合におけるルール交換型プロトコルの検証 複数データベースのルール交換を行うことによって,検索に有効なルールが導出できることを検証し,性能評価も行った.また,「問答」により求まる検索支援ルールの性能評価について国際会議で発表を行った.
|
Research Products
(6 results)
-
[Publications] 川原 稔: "文献情報検索支援システムのROC解析による相関ルール選択基準"情報処理学会研究会論文誌データベース. 40. 105-113 (1999)
-
[Publications] 河野浩之: "テキストマイニングを用いた文書検索システム"情報知識学会 第7回(1999年度)研究報告会講演論文集. 15-20 (1999)
-
[Publications] Kawahara,M: "Performance Evaluation and Visualization of Association Rules using Receiver Operating Characteristic Graph"International Symposium on Database Applications in Non-Traditional Environments,DANTE'99. 333-342 (1999)
-
[Publications] Kawahara,M: "Mining Association Algorithm Based on ROC Convex Hull Method in Bibliographic Navigation System"Proc.of Second International Conferences DS'99. 333-334 (1999)
-
[Publications] Kawahara,M: "ROC Performance Evaluation of Web-based Bibliographic Navigator using Mining Assosiation Rules"Proc.of 1999 International Computer Science Conference,ICSC'99. 216-225 (1999)
-
[Publications] Kawahara,M: "An Application of Text Mining : Bibliographic Navigator Powered by Extended Association Rules"Proc.of Hawaii International Conference on System Sciences(HICSS-33). 34-34 (2000)