• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発

研究課題

研究課題/領域番号 16016266
研究機関北海道大学

研究代表者

有村 博紀  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

研究分担者 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
篠原 歩  九州大学, 大学院・システム情報科学研究院, 助教授 (00226151)
下薗 真一  九州工業大学, 情報工学部, 助教授 (70243988)
湊 真一  北海道大学, 大学院・情報科学研究科, 助教授 (10374612)
キーワード半構造データ / ウェブマイニング / XMLデータ / グラフマイニング / パターン照合 / 系列パターン / 機械学習 / 文法圧縮
研究概要

本研究では,大量のウェブページやXML等の大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの実現方式を明らかにすることを目標としている.鍵になる技術として,最適パターン発見を木やグラフ構造に拡張し,計算量理論と計算学習理論の最新の成果を援用しながら,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムの開発に取り組んだ.平成16年度は,前年度の成果に基づき,(a)有用な情報源の発見,(b)特徴的なパターンの発見,(c)情報の抽出の3つの情報獲得問題について,次の研究を行った.
(1)前年度開発した最適分類パターンの決定木学習システムBONSAIへの組み込みによる,高精度テキスト自動分類手法を,複数のパターンのブール結合に一般化した(竹田・篠原).
(2)XPathパターンに対する最適パターン発見アルゴリズムを設計し,半構造データマイニングエンジンを開発した.とくに今回は,より現実の半構造データに近い無順序木モデルに対して,高速なパターン発見エンジンを開発した.パターンの圧縮表現に対する,高速な列挙アルゴリズムを開発した.独自に開発したオンライン化技術を用いて,オンラインパターン発見手法を開発した(有村).これに関連して,電子情報通信学会第14回データ工学ワークショップ優秀論文賞をH16年7月に受賞した.また,これまでに開発した半構造検索とマイニングの有機的結合のための高速半構造ストリーム照合システムに関して,情報処理学会山下記念研究賞をH16年11月に受賞した.
(3)半構造データからの情報抽出や圧縮と密接な関係に関して,理論的に性能評価をもつち,半構造データに適した線形時間文法圧縮アルゴリズムを開発し,性能に関する理論的解析を行った.並行して,2次元空間に散在した点列に対する近似パターン照合アルゴリズムの計算量を開発し(下薗,篠原),個々のアルゴリズムの最適化をおこない,性能を向上させた(全員).最後に,ウェブデータとXMLデータに関する評価実験をおこない,この方式の有効性を評価した(有村・篠原).抽出した知識索引に関して,BDDを用いた大規模トランザクションデータ管理法を開発した(湊・喜田・有村)

  • 研究成果

    (6件)

すべて 2005 2004

すべて 雑誌論文 (6件)

  • [雑誌論文] 大規模データストリームのためのマイニング技術の動向2005

    • 著者名/発表者名
      有村博紀
    • 雑誌名

      電気情報通信学会論文誌 J88-D-I・2(印刷中)

  • [雑誌論文] Efficient Substructure Discovery from Large Semi-structured Data2004

    • 著者名/発表者名
      H.Arimura, H.Sakamoto他4名
    • 雑誌名

      IEICE Transactions on Information and Systems E87-D・12

      ページ: 2754-2763

  • [雑誌論文] An Efficient Algorithm for Enumerating Closed Patterns in Transaction Databases2004

    • 著者名/発表者名
      H.Arimura他3名
    • 雑誌名

      Proc.the 7th International Conference on Discovery Science (DS' 04) LNAI3245

      ページ: 16-30

  • [雑誌論文] Finding Optimal Pairs of Cooperative and Competing Patterns with Bounded Distance2004

    • 著者名/発表者名
      A.Shinohara, M.Takeda他5名
    • 雑誌名

      Proc.The 7th International Conference on Discovery Science (DS 2004) LNAI3245

      ページ: 32-46

  • [雑誌論文] A Space-Saving Linear-Time Algorithm for Grammar-Based Compression2004

    • 著者名/発表者名
      H.Sakamoto他2名
    • 雑誌名

      Proc.11^<th> International Symposium on String Processing and Information Retrieval (SPIRE 2004) LNCS

  • [雑誌論文] Approximate point set pattern matching on sequences and planes2004

    • 著者名/発表者名
      T.Kida, H.Arimura
    • 雑誌名

      Proc.the 15th Annual Symposium on Combinatorial Pattern Matching (CPM 2004) LNCS3109

      ページ: 218-229

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi