• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発

Research Project

Project/Area Number 16016266
Research InstitutionHokkaido University

Principal Investigator

トーマス ツォイクマン  北海道大学, 大学院・情報科学研究科, 教授 (60374609)

Co-Investigator(Kenkyū-buntansha) 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
下薗 真一  九州工業大学, 情報工学部, 助教授 (70243988)
湊 真一  北海道大学, 大学院・情報科学研究科, 助教授 (10374612)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
Keywords半構造データ / ウェブマイニング / XMLデータ / グラフマイニング / パターン照合 / 系列パターン / 機械学習 / 文法圧縮
Research Abstract

本研究は,大量のウェブページやXML等の大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの実現方式を明らかにすることを目標としている.その鍵になる技術として,最適パターン発見を木やグラフ構造に拡張し,計算量理論と計算学習理論の最新の成果を援用しながら,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムの開発に取り組んだ.
平成17年度は,初年度から昨年度までの研究成果と統合し,最適半構造マイニングのプロトタイプシステム構築を目指した.研究項目としては,有用な情報源の発見,特徴的なパターンの発見,情報の抽出の3つの情報獲得問題に加えて,昨年度から新たに研究を開始した知識索引問題について取り組んだ.今年度得られた具体的な結果のうち主要なものは以下のとおりである.
(1)大規模なトランザクションデータによく見られる疎な組み合わせ集合データを効率よく扱うことのできるデータ構造であるZBDD(Zero-suppress BDD)をベースに,その構造の元で重み付き積和集合を計算可能なZBDDパッケージツールVSOP(Valued Sum-Of-Products)の開発を推し進め,頻出するパターン集合を表現するZBDDを単純直交分解する機能を追加した.これにより,そのデータに内包された意味的構造を自動抽出することが可能になった.(湊)
(2)パターン発見アルゴリズムによる分類・予測の長期的ふるまいに関する理論保証を与えることに成功した.(ツォイクマン)
(3)系列データからの極大モチーフパターンを効率よく枚挙するアルゴリズムを得た.(有村:H13-H16代表)
(4)Arc構造付きテキストに対する高速なパターン照合アルゴリズムを得た.(喜田)

  • Research Products

    (6 results)

All 2006 2005

All Journal Article (6 results)

  • [Journal Article] Text Mining Using Markov Chains of Variable Length2006

    • Author(s)
      Bjorn Hoffmeister, Thomas Zeugmann
    • Journal Title

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      Pages: 1-24

  • [Journal Article] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • Author(s)
      Takuya Kida
    • Journal Title

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      Pages: 25-39

  • [Journal Article] Inductive Inference of Approximations for Recursive Concepts2005

    • Author(s)
      Steffen Lange, Gunter Grieser, Thomas Zeugmann
    • Journal Title

      Theoretical Computer Science 348(1)

      Pages: 15-40

  • [Journal Article] Efficient Database Analysis Using VSOP Calculator Based on Zero-suppressed BDDs2005

    • Author(s)
      Sin-ichi Minato
    • Journal Title

      Proc.of JSAI Workshop on Learning with Logics and Logics for Learning(LLLL) No.3

      Pages: 3-9

  • [Journal Article] Finding Simple Disjoint Decompositions in Frequent Itemset Data Using Zero-suppressed BDD2005

    • Author(s)
      Sin-ichi Minato
    • Journal Title

      Proc.of IEEE ICDM 2005 workshop on Computational Intelligence in Data Mining TRN2005-09

      Pages: 3-11

  • [Journal Article] Efficient Combinatorial Item Set Analysis Based on Zero-Suppressed BDDs2005

    • Author(s)
      Sin-ichi Minato, Hiroki Arimura(H13-H16代表者)
    • Journal Title

      Proc.of IEEE/IEICE/IPSJ International Workshop on Challenges in Web Information Retrieval and Integration IEEE CS P2414

      Pages: 3-10

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi