• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発

研究課題

研究課題/領域番号 16016266
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関北海道大学

研究代表者

トーマス ツォイクマン (2005)  北海道大学, 大学院・情報科学研究科, 教授 (60374609)

有村 博紀 (2004)  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

研究分担者 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
下薗 真一  九州工業大学, 情報工学部, 助教授 (70243988)
湊 真一  北海道大学, 大学院・情報科学研究科, 助教授 (10374612)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
7,900千円 (直接経費: 7,900千円)
2005年度: 3,600千円 (直接経費: 3,600千円)
2004年度: 4,300千円 (直接経費: 4,300千円)
キーワード半構造データ / ウェブマイニング / XMLデータ / グラフマイニング / パターン照合 / 系列パターン / 機械学習 / 文法圧縮
研究概要

本研究は,大量のウェブページやXML等の大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの実現方式を明らかにすることを目標としている.その鍵になる技術として,最適パターン発見を木やグラフ構造に拡張し,計算量理論と計算学習理論の最新の成果を援用しながら,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムの開発に取り組んだ.
平成17年度は,初年度から昨年度までの研究成果と統合し,最適半構造マイニングのプロトタイプシステム構築を目指した.研究項目としては,有用な情報源の発見,特徴的なパターンの発見,情報の抽出の3つの情報獲得問題に加えて,昨年度から新たに研究を開始した知識索引問題について取り組んだ.今年度得られた具体的な結果のうち主要なものは以下のとおりである.
(1)大規模なトランザクションデータによく見られる疎な組み合わせ集合データを効率よく扱うことのできるデータ構造であるZBDD(Zero-suppress BDD)をベースに,その構造の元で重み付き積和集合を計算可能なZBDDパッケージツールVSOP(Valued Sum-Of-Products)の開発を推し進め,頻出するパターン集合を表現するZBDDを単純直交分解する機能を追加した.これにより,そのデータに内包された意味的構造を自動抽出することが可能になった.(湊)
(2)パターン発見アルゴリズムによる分類・予測の長期的ふるまいに関する理論保証を与えることに成功した.(ツォイクマン)
(3)系列データからの極大モチーフパターンを効率よく枚挙するアルゴリズムを得た.(有村:H13-H16代表)
(4)Arc構造付きテキストに対する高速なパターン照合アルゴリズムを得た.(喜田)

報告書

(2件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (12件)

すべて 2006 2005 2004

すべて 雑誌論文 (12件)

  • [雑誌論文] Text Mining Using Markov Chains of Variable Length2006

    • 著者名/発表者名
      Bjorn Hoffmeister, Thomas Zeugmann
    • 雑誌名

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      ページ: 1-24

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • 著者名/発表者名
      Takuya Kida
    • 雑誌名

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      ページ: 25-39

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Inductive Inference of Approximations for Recursive Concepts2005

    • 著者名/発表者名
      Steffen Lange, Gunter Grieser, Thomas Zeugmann
    • 雑誌名

      Theoretical Computer Science 348(1)

      ページ: 15-40

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Efficient Database Analysis Using VSOP Calculator Based on Zero-suppressed BDDs2005

    • 著者名/発表者名
      Sin-ichi Minato
    • 雑誌名

      Proc.of JSAI Workshop on Learning with Logics and Logics for Learning(LLLL) No.3

      ページ: 3-9

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Finding Simple Disjoint Decompositions in Frequent Itemset Data Using Zero-suppressed BDD2005

    • 著者名/発表者名
      Sin-ichi Minato
    • 雑誌名

      Proc.of IEEE ICDM 2005 workshop on Computational Intelligence in Data Mining TRN2005-09

      ページ: 3-11

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Efficient Combinatorial Item Set Analysis Based on Zero-Suppressed BDDs2005

    • 著者名/発表者名
      Sin-ichi Minato, Hiroki Arimura(H13-H16代表者)
    • 雑誌名

      Proc.of IEEE/IEICE/IPSJ International Workshop on Challenges in Web Information Retrieval and Integration IEEE CS P2414

      ページ: 3-10

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 大規模データストリームのためのマイニング技術の動向2005

    • 著者名/発表者名
      有村博紀
    • 雑誌名

      電気情報通信学会論文誌 J88-D-I・2(印刷中)

    • NAID

      110003207353

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Efficient Substructure Discovery from Large Semi-structured Data2004

    • 著者名/発表者名
      H.Arimura, H.Sakamoto他4名
    • 雑誌名

      IEICE Transactions on Information and Systems E87-D・12

      ページ: 2754-2763

    • NAID

      110003213885

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] An Efficient Algorithm for Enumerating Closed Patterns in Transaction Databases2004

    • 著者名/発表者名
      H.Arimura他3名
    • 雑誌名

      Proc.the 7th International Conference on Discovery Science (DS' 04) LNAI3245

      ページ: 16-30

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Optimal Pairs of Cooperative and Competing Patterns with Bounded Distance2004

    • 著者名/発表者名
      A.Shinohara, M.Takeda他5名
    • 雑誌名

      Proc.The 7th International Conference on Discovery Science (DS 2004) LNAI3245

      ページ: 32-46

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] A Space-Saving Linear-Time Algorithm for Grammar-Based Compression2004

    • 著者名/発表者名
      H.Sakamoto他2名
    • 雑誌名

      Proc.11^<th> International Symposium on String Processing and Information Retrieval (SPIRE 2004) LNCS

    • NAID

      110003178856

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Approximate point set pattern matching on sequences and planes2004

    • 著者名/発表者名
      T.Kida, H.Arimura
    • 雑誌名

      Proc.the 15th Annual Symposium on Combinatorial Pattern Matching (CPM 2004) LNCS3109

      ページ: 218-229

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi