• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

知識発見・学習を用いた動的情報提供サイト群からの情報獲得に関する研究

研究課題

研究課題/領域番号 15300027
研究機関筑波大学

研究代表者

北川 博之  筑波大学, 大学院・システム情報工学研究科, 教授 (00204876)

研究分担者 石川 佳治  筑波大学, 大学院・システム情報工学研究科, 助教授 (80263440)
庄司 功  筑波大学, 大学院・システム情報工学研究科, 教授 (20282329)
森嶋 厚行  筑波大学, 大学院・図書館情報メディア研究科, 助教授 (70338309)
品川 徳秀  独立行政法人科学技術振興機構, 研究員 (60334215)
キーワードWeb / 知識発見 / 機械学習 / 情報探索 / Hidden Web / 時系列ストリーム / XML
研究概要

近年のインターネット技術の急速な進展により,様々な情報提供サイトが利用可能となっている,これらの中には,Webページ生成プログラム等を用いて動的に内包データを提供する情報生成型サイトや,連続的に新しい情報を提供する時系列ストリーム型サイトがある,本研究は,知識発見・学習機能を有機的に融合したWeb情報獲得の新しい技術の開発を目的としている。
今年度は主に以下の項目に関する基盤技術の研究開発を行った。
1.サイトプロプロファイルの獲得を目的として昨年度開発した下記手法について、より本格的な実験評価、改良、高度化研究を推進した.
(1)情報生成型サイトに対する手法として,テキストデータベースを内包したHidden Webサイトからの新規トピック文書の獲得手法
(2)時系列ストリーム型サイトに対する手法として,テキストストリームが内包するトピックや異常値の検出手法
2.分類学習を利用したWebからの情報獲得,特定分野のWeb情報獲得手法について研究を推進した.特に,タキソノミーを用いたWeb検索や地理情報データベースと連携したWeb探索手法を開発した.
3.各種情報提供サイトから得られた情報の統合的利用を可能とするため,情報源のプロファイルを考慮しつつ獲得情報の統合処理を行うための方式について,性能向上や実データを用いた実証研究を行った。
4.各種情報源から提供されるバイナリデータをXMLデータにマッピングして操作するための体系を開発し、システム構築並びに検証実験を実施した.
5.時系列ストリーム型サイトから提供される情報の到着頻度とキーワードとの関連性に着目し、コンテンツ特性をプロファイル化するための手法を開発した,
6.情報生成型サイトからプライバシー保護等の目的のため生データではなくノイズを入れる等の前処理がなされたデータが提供される場合を想定し,そのような状況下での知識発見手法を開発した.

  • 研究成果

    (25件)

すべて 2005 2004

すべて 雑誌論文 (25件)

  • [雑誌論文] Conveying Taxonomy Context for Topic-Focused Web Search2005

    • 著者名/発表者名
      Said Mirza Pahlevi
    • 雑誌名

      Journal of the American Society for Information Science and Technology 56・2

      ページ: 173-188

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 移動ウィンドウ方式に基づくテキストデータからのトピック検出2005

    • 著者名/発表者名
      濱本雅史
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) (Web出版)

  • [雑誌論文] 地域ウェブ情報源の収集のためのクローリング手法の提案2005

    • 著者名/発表者名
      張建偉
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) (Web出版)

  • [雑誌論文] セルフチューニングによる連続的問合せの適応的問合せ最適化2005

    • 著者名/発表者名
      渡辺陽介
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) (Web出版)

  • [雑誌論文] ストリーム統合システムを用いた実世界情報の統合利用2005

    • 著者名/発表者名
      山田真一
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) (Web出版)

  • [雑誌論文] セキュリティを考慮したRDBのXMLビュー機構の検討2005

    • 著者名/発表者名
      品川徳秀
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) (Web出版)

  • [雑誌論文] ノイズを含むデータに対するFP木を用いた相関ルールマイニング2005

    • 著者名/発表者名
      成田和世
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) (Web出版)

  • [雑誌論文] Topic Activation Analysis for Document Streams Based on Document Arrival Rate and Relevance2005

    • 著者名/発表者名
      Chunhua Cui
    • 雑誌名

      Proc.20th Annual ACM Symposium on Applied Computing(SAC 2005) 2

      ページ: 1089-1095

  • [雑誌論文] バイナリデータに対するXMLビューの実現2005

    • 著者名/発表者名
      品川徳秀
    • 雑誌名

      電子情報通信学会論文誌 J-88-D1・3

      ページ: 604-616

  • [雑誌論文] Hidden Webサイトからの新規トピック文書の抽出2005

    • 著者名/発表者名
      毛利隆軌
    • 雑誌名

      情報処理学会論文誌 (採録決定)

  • [雑誌論文] Extended Link Analysis for Extracting Spatial Information Hubs2005

    • 著者名/発表者名
      Jianwei Zhang
    • 雑誌名

      Proc.International Workshop on Challenges in Web Information Retrieval and Integration(WIRI 2005) 印刷中

  • [雑誌論文] A Method of Detecting Outliers Matching Users' Intentions2004

    • 著者名/発表者名
      Cui Zhu
    • 雑誌名

      日本データベース学会Letters 3・1

      ページ: 93-96

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 到着頻度と関連性を考慮した時系列文書のトピック分析2004

    • 著者名/発表者名
      崔春花
    • 雑誌名

      日本データベース学会Letters 3・2

      ページ: 37-40

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Example-based Outlier Detection with Relevance Feedback2004

    • 著者名/発表者名
      Cui Zhu
    • 雑誌名

      日本データベース学会Letters 3・2

      ページ: 5-8

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 連続的問合せに対する複数問合せ最適化手法2004

    • 著者名/発表者名
      渡辺陽介
    • 雑誌名

      電子情報通信学会論文誌 J-87-D-I・10

      ページ: 873-886

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Extracting New Topic Contents from Hidden Web Sites2004

    • 著者名/発表者名
      Takanori Mouri
    • 雑誌名

      Proc.IEEE International Conference on Information Technology(ITCC 2004)

      ページ: 314-319

  • [雑誌論文] OBE : Outlier by Example2004

    • 著者名/発表者名
      Cui Zhu
    • 雑誌名

      Proc.8th Pacific-Asia Conference on Knowledge Discovery and Data Mining(PAKDD 2004)

      ページ: 222-234

  • [雑誌論文] AutoSplit : Fast and Scalable Discovery of Hidden Variables in Stream and Multimedia Databases2004

    • 著者名/発表者名
      Jia-Yu Pan
    • 雑誌名

      Proc.8th Pacific-Asia Conference on Knowledge Discovery and Data Mining(PAKDD 2004)

      ページ: 519-528

  • [雑誌論文] Constructing XML Views over Binary Data2004

    • 著者名/発表者名
      Norihide Shinagawa
    • 雑誌名

      Proc.8th International Database Engineering and Applications Symposium(IDEAS' 04)

      ページ: 470-474

  • [雑誌論文] 連続的問合せを用いたテキストストリームに対する類似検索2004

    • 著者名/発表者名
      渡辺陽介
    • 雑誌名

      情報処理学会研究報告 2004・71

      ページ: 237-244

  • [雑誌論文] 到着頻度と関連性を考慮した時系列文書の連続的トピック分析2004

    • 著者名/発表者名
      崔春花
    • 雑誌名

      情報処理学会研究報告 2004・72

      ページ: 315-322

  • [雑誌論文] 空間情報ハブ抽出のためのウェブリンク解析手法の開発2004

    • 著者名/発表者名
      張建偉
    • 雑誌名

      情報処理学会研究報告 2004・72

      ページ: 403-410

  • [雑誌論文] Interactive Outlier Detection Adaptive to Users' Intentions2004

    • 著者名/発表者名
      Cui Zhu
    • 雑誌名

      情報処理学会研究報告 2004・72

      ページ: 403-410

  • [雑誌論文] RDB上のXSLT実体化ビューのインクリメンタルな更新手法2004

    • 著者名/発表者名
      石川佳治
    • 雑誌名

      日本データベース学会Letters 3・3

      ページ: 25-28

  • [雑誌論文] 空間情報ハブ抽出のためのウェブリンク解析手法2004

    • 著者名/発表者名
      張建偉
    • 雑誌名

      日本データベース学会Letters 3・3

      ページ: 9-12

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi