2003 Fiscal Year Annual Research Report
知識発見・学習を用いた動的情報提供サイト群からの情報獲得に関する研究
Project/Area Number |
15300027
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | University of Tsukuba |
Principal Investigator |
北川 博之 筑波大学, 電子・情報工学系, 教授 (00204876)
|
Co-Investigator(Kenkyū-buntansha) |
森嶋 厚行 筑波大学, 図書館情報学系, 助教授 (70338309)
庄司 功 筑波大学, 社会工学系, 教授 (20282329)
石川 佳治 筑波大学, 電子・情報工学系, 助教授 (80263440)
品川 徳秀 千葉大学, 環境リモートセンシング研究センター, 助手 (60334215)
|
Keywords | Web / 知識発見 / 機械学習 / 情報探索 / Hidden Web / 時系列ストリーム / XML |
Research Abstract |
近年のインターネット技術の急速な進展により,様々な情報提供サイトが利用可能となっている.これらの中には,Webページ生成プログラム等を用いて動的に内包データを提供する情報生成型サイトや,連続的に新しい情報を提供する時系列ストリーム型サイトがある.本研究は,インターネット環境における情報獲得に知識発見・学習機能を有機的に融合した新しい技術を開発し,動的情報提供サイトからの高精度な情報獲得と利用者に優しいシステム操作環境の提供を実現することを目的とする. 今年度は主に以下の項目に関する基盤技術の研究開発を行った. 1.動的情報提供サイトの最新トピックやコンテンツの特性等を自動抽出する手法を開発した. (1)情報生成型サイトに対する手法として,テキストデータベースを内包したHidden Webサイトから新規トピック文書を獲得するための手法を開発し,実験評価でその有効性を確認した. (2)時系列ストリーム型サイトに対する手法として,テキストストリームが内包するトピックや異常値の検出を行う手法を開発し,実験評価でその有効性を確認した. 2.学習機能を用いてWebからの情報獲得を支援する手法を開発した.特に,タキソノミーを利用したWeb検索精度の向上,特定分野のWebページの収集法等を開発した. 3.各種情報提供サイトから得られた情報の統合的利用を可能とするため,情報源の特性を考慮しつつ獲得情報を統合処理を行うための方式について研究を推進した. 3.XMLデータを対象として,利用者から与えられた例示オブジェクトやパターンを用いて利用者要求の把握を可能とする学習機能付利用者インタフェースを開発した.また,本操作系の適用対象を拡大するため,バイナリデータをXMLデータとして扱うための手法について検討した.
|
Research Products
(32 results)
-
[Publications] Said Mirza Palevi: "Taxonomy-based Context Conveyance for Web Search"Proc.10th International Conference on Cooperative Information Systems (CoopIS 2003). 536-553 (2003)
-
[Publications] Yoshiharu Ishikawa: "Implementation and Evaluation of an Adaptive Neighborhood Information Retrieval System for Mobile Users"Proc.3rd International Workshop on Web and Wireless Geographic Information Systems (W^2GIS). 25-33 (2003)
-
[Publications] Tomoaki Kajino: "Requirement Specification and Derivation of ECA Rules for Integrating Multiple Dissemination-Based Information Sources"IEICE Transactions on Information and Systems. E87-D-1. 3-14 (2004)
-
[Publications] 塚本祐一: "異動オブジェクトへの周辺情報提供のための空間データベース検索システムの実装と評価"電子情報通信学会論文誌. J-87-D-I-2. 202-215 (2004)
-
[Publications] Yousuke Watanabe: "A Multiple Continuous Query Optimization Method Based on Query Execution Pattern Analysis"Proc.9th International Conference on Database Systems for Advanced Applications (DASFAA 2004). 443-456 (2004)
-
[Publications] Atsuyuki Morishima: "A Machine Learning Approach to Rapid Development of XML Mapping Queries"Proc.20th IEEE International Conference on Date Engineering (ICDE 2004). 276-287 (2004)
-
[Publications] Takanori Miuri: "Extracting New Topic Contents from Hidden Web Sites"Proc.IEEE International Conference on Information Technology (ITCC 2004). (掲載予定). (2004)
-
[Publications] Cui Zhu: "OBE : Outlier by Example"Proc.8th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2004). (掲載予定). (2004)
-
[Publications] ia-Yu Pan: "AutoSplit : Fast and Scalable Discovery of Hidden Variables in Stream and Multimedia Databases"Proc.8th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2004). (掲載予定). (2004)
-
[Publications] 渡辺陽介: "連続的問合せに対する複数問合せ最適化手法"電子情報通信学会論文誌. (掲載予定). (2004)
-
[Publications] 塚本祐一: "索引付けされた移動軌跡データからの効率的な移動統計量抽出法"日本データベース学会Letters. 2-1. 27-30 (2003)
-
[Publications] 渡辺陽介: "連続的問合せを対象とした複数問合せ最適化方式の提案"日本データベース学会Letters. 2-1. 79-82 (2003)
-
[Publications] 毛利隆軌: "プロービングによるテキストデータベースからの新規トピック文書抽出"日本データベース学会Letters. 2-1. 107-110 (2003)
-
[Publications] 森嶋厚行: "例示操作に基づくXQuery問合せ学習システムのプロトタイプ開発"日本データベース学会Letters. 2-1. 119-122 (2003)
-
[Publications] 塚本祐一: "索引付けされた移動軌跡データからの効率的な移動統計量抽出法の評価"日本データベース学会Letters. 2-2. 21-24 (2003)
-
[Publications] 毛利隆軌: "プロービングにクラスタリングによる新規トピック文書抽出"日本データベース学会Letters. 2-2. 76-80 (2003)
-
[Publications] 品川徳秀: "バイナリデータ上のXMLビュー機構とXPath処理の提案"日本データベース学会Letters. 2-3. 53-56 (2003)
-
[Publications] 石川佳治: "忘却の概念に基づくクラスタリング手法の改良方式"日本データベース学会Letters. 2-3. 53-56 (2003)
-
[Publications] 渡辺陽介: "ストリームの動的特性変化を考慮した連続的問合せ最適化方式"情報処理学会研究報告. 2003-71. 203-210 (2003)
-
[Publications] 塚本祐一: "索引付けされた移動軌跡データからの移動統計量の抽出法の評価"情報処理学会研究報告. 2003-71. 227-234 (2003)
-
[Publications] 毛利隆軌: "プロービングとクラスタリングを用いた新規トピック文書抽出"情報処理学会研究報告. 2003-72. 133-140 (2003)
-
[Publications] 崔春花: "タキソノミーを用いたWeb統合検索処理の効率化"情報処理学会研究報告. 2003-72. 117-124 (2003)
-
[Publications] 石川佳治: "忘却の概念に基づくクラスタリング手法の改良方式について"情報処理学会研究報告. 2003-112. 1-7 (2003)
-
[Publications] 渡辺陽介: "問合せ最適化機構を備えたデータストリーム統合システムの開発"DEWS2004. (Web出版). (2004)
-
[Publications] 濱本雅史: "独立成分分析を用いたテキストデータからのトピック検出"DEWS2004. (Web出版). (2004)
-
[Publications] 崔春花: "到着頻度と関連性を考慮した文書ストリームのトピック分析"DEWS2004. (Web出版). (2004)
-
[Publications] 渡辺 陽介: "問合せ最適化機構を備えたデータストリーム統合システムの開発"DEWS2004. (Web出版). (2004)
-
[Publications] 塚本祐一: "移動軌跡ストリームからの移動統計量推定のための動的ヒストグラム構築手法について"DEWS2004. (Web出版). (2004)
-
[Publications] 品川徳秀: "バイナリデータ上のXMLビューにおけるDOM更新のサポートの検討"DEWS2004. (Web出版). (2004)
-
[Publications] 毛利隆軌: "Hidden Webサイトからの新規トピック文書抽出におけるプロービングの効率化"DEWS2004. (Web出版). (2004)
-
[Publications] Cui Zhu: "Outlier Detection Adaptive to Users' Intentions"DEWS2004. (Web出版). (2004)
-
[Publications] 宮坂 集策: "XSLTにより定義されたXML実体化ビューのインクリメンタルな管理手法"DEWS2004. (Web出版). (2004)