• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

知識発見・学習を用いた動的情報提供サイト群からの情報獲得に関する研究

研究課題

研究課題/領域番号 15300027
研究機関筑波大学

研究代表者

北川 博之  筑波大学, 大学院・システム情報工学研究科, 教授 (00204876)

研究分担者 石川 佳治  筑波大学, 大学院・システム情報工学研究科, 助教授 (80263440)
天笠 俊之  筑波大学, 大学院・システム情報工学研究科, 講師 (70314531)
庄司 功  筑波大学, 大学院システム情報工学研究科, 教授 (20282329)
森嶋 厚行  筑波大学, 図書館情報メディア研究科, 助教授 (70338309)
キーワードWeb / 知識発見 / 知識抽出 / 情報探索 / 時系列ストリーム / XML / 異常値検出
研究概要

近年のインターネット技術の急速な進展により,様々な情報提供サイトが利用可能となっている.これらの中には,Webページ生成プログラム等を用いて動的に内包データを提供する情報生成型サイトや,連続的に新しい情報を提供する時系列ストリーム型サイトがある.本研究では,インターネット環境における動的情報提供サイトからの高精度な情報獲得と利用者に優しい操作環境の実現を目的として,知識発見・学習機能を用いた情報獲得手法に関する研究を推進している.
今年度は主に以下の項目に関する基盤技術の研究開発を行った.
1.データベース中のデータを用いて特定分野のWeb情報を獲得する手法について研究を推進した.特に,Webからの知識抽出とデータクリーニングを組み合わせた手法を開発した.
2.サイトプロファイリングに利用可能な知識発見手法として,異常値の検出手法(特に高次元データを対象とした手法)を開発した.
3.同様にサイトプロファイリングに利用可能な知識発見手法として,データ間の比率相関性の検出手法やクラスタ分析手法を開発した.
4.blog等の時系列テキストから主要なトピックを抽出する手法を行う手法を開発した.
5.固有表現に着目したテキストのクラスタ分析手法を開発した.
6.P2P環境等の分散環境において,プロファイル情報を共有するための基盤技術を開発した.
7.実世界の情報提供サイトに含まれるノイズを考慮した相関ルールマイニング手法を開発した.
8.各種情報源から提供されるデータをXMLにラッピングして操作することを想定し,分散・並列処理環境においてXMLデータの効率的検索を行う手法を開発した.

  • 研究成果

    (17件)

すべて 2005

すべて 雑誌論文 (17件)

  • [雑誌論文] 固有表現に着目したニュース記事分類手法の提案2005

    • 著者名/発表者名
      戸田浩之
    • 雑誌名

      電子情報通信学会技術研究報告 105-171

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Extended Link Analysis for Extracting Spatial Information Hubs2005

    • 著者名/発表者名
      Jianwei Zhang
    • 雑誌名

      Proc.International Workshop on Challenges in Web Information Retrieval and Integration (WIRI 2005)

      ページ: 17-22

  • [雑誌論文] Example-Based Outlier Detection for High Dimensional Datasets2005

    • 著者名/発表者名
      Cui Zhu
    • 雑誌名

      情報処理学会論文誌 46-SIG8(TOD26)

      ページ: 120-129

  • [雑誌論文] Mining Frequent Closed Itemsets from Privacy Preserving Data2005

    • 著者名/発表者名
      Kazuyo Narita
    • 雑誌名

      Proc.IADIS International Conference e-Society 2005

      ページ: 355-362

  • [雑誌論文] ノイズを含むデータに対するFP木を用いた頻出飽和アイテム集合マイニング2005

    • 著者名/発表者名
      成田 和世
    • 雑誌名

      日本データベース学会Letters 4-1

      ページ: 157-160

  • [雑誌論文] 多重比率規則抽出のためのデータ分析手法2005

    • 著者名/発表者名
      濱本雅史
    • 雑誌名

      電子情報通信学会技術研究報告 105-172

      ページ: 37-42

  • [雑誌論文] 例示データに基づく選択的ウェブクローリング手法について2005

    • 著者名/発表者名
      張建偉
    • 雑誌名

      電子情報通信学会技術研究報告 105-172

      ページ: 55-60

  • [雑誌論文] Example-Based Robust Outlier Detection in High Dimensional Datasets2005

    • 著者名/発表者名
      Cui Zhu
    • 雑誌名

      Proc.5th IEEE International Conference on Data Mining (ICDM 2005)

  • [雑誌論文] LocalRank : A Prototype for Ranking Web Pages with Database Considering Geographical Locality2005

    • 著者名/発表者名
      Jianwei Zhang
    • 雑誌名

      Proc. the Eighth Asia Pacific Web Conference (APWeb 2006)

  • [雑誌論文] P2Pデータ流通における注釈を用いたトレーサビリティ実現手法の検討2005

    • 著者名/発表者名
      石川佳治
    • 雑誌名

      情報処理学会研究報告 2006-9

      ページ: 117-124

  • [雑誌論文] サポートと確信度を考慮した比率規則マイニング2005

    • 著者名/発表者名
      濱本雅史
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

  • [雑誌論文] 情報源の選択に基づくウェブからのレコード抽出手法 Extracting Records from the Web Based on Web Source Selection2005

    • 著者名/発表者名
      張 建偉
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

  • [雑誌論文] Incremental Clustering Based on Novelty of On-line Documents - Experiments and Evaluation2005

    • 著者名/発表者名
      Sophoin KHY
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

  • [雑誌論文] ノイズ入りデータからの頻出アイテム集合の推定2005

    • 著者名/発表者名
      成田和世
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

  • [雑誌論文] PCクラスタを用いたXMLデータ並列処理方式の提案2005

    • 著者名/発表者名
      城戸健太郎
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

  • [雑誌論文] Blogにおける人物に関する"旬な"話題の抽出2005

    • 著者名/発表者名
      外間智子
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

  • [雑誌論文] P2P環境における構造概要を利用したXMLデータの検索 XML Retrieval Using Structural Summary in Peer-to-Peer Environment2005

    • 著者名/発表者名
      呉俊輝
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi