• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発

研究課題

研究課題/領域番号 16016266
研究機関北海道大学

研究代表者

トーマス ツォイクマン  北海道大学, 大学院・情報科学研究科, 教授 (60374609)

研究分担者 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
下薗 真一  九州工業大学, 情報工学部, 助教授 (70243988)
湊 真一  北海道大学, 大学院・情報科学研究科, 助教授 (10374612)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
キーワード半構造データ / ウェブマイニング / XMLデータ / グラフマイニング / パターン照合 / 系列パターン / 機械学習 / 文法圧縮
研究概要

本研究は,大量のウェブページやXML等の大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの実現方式を明らかにすることを目標としている.その鍵になる技術として,最適パターン発見を木やグラフ構造に拡張し,計算量理論と計算学習理論の最新の成果を援用しながら,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムの開発に取り組んだ.
平成17年度は,初年度から昨年度までの研究成果と統合し,最適半構造マイニングのプロトタイプシステム構築を目指した.研究項目としては,有用な情報源の発見,特徴的なパターンの発見,情報の抽出の3つの情報獲得問題に加えて,昨年度から新たに研究を開始した知識索引問題について取り組んだ.今年度得られた具体的な結果のうち主要なものは以下のとおりである.
(1)大規模なトランザクションデータによく見られる疎な組み合わせ集合データを効率よく扱うことのできるデータ構造であるZBDD(Zero-suppress BDD)をベースに,その構造の元で重み付き積和集合を計算可能なZBDDパッケージツールVSOP(Valued Sum-Of-Products)の開発を推し進め,頻出するパターン集合を表現するZBDDを単純直交分解する機能を追加した.これにより,そのデータに内包された意味的構造を自動抽出することが可能になった.(湊)
(2)パターン発見アルゴリズムによる分類・予測の長期的ふるまいに関する理論保証を与えることに成功した.(ツォイクマン)
(3)系列データからの極大モチーフパターンを効率よく枚挙するアルゴリズムを得た.(有村:H13-H16代表)
(4)Arc構造付きテキストに対する高速なパターン照合アルゴリズムを得た.(喜田)

  • 研究成果

    (6件)

すべて 2006 2005

すべて 雑誌論文 (6件)

  • [雑誌論文] Text Mining Using Markov Chains of Variable Length2006

    • 著者名/発表者名
      Bjorn Hoffmeister, Thomas Zeugmann
    • 雑誌名

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      ページ: 1-24

  • [雑誌論文] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • 著者名/発表者名
      Takuya Kida
    • 雑誌名

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      ページ: 25-39

  • [雑誌論文] Inductive Inference of Approximations for Recursive Concepts2005

    • 著者名/発表者名
      Steffen Lange, Gunter Grieser, Thomas Zeugmann
    • 雑誌名

      Theoretical Computer Science 348(1)

      ページ: 15-40

  • [雑誌論文] Efficient Database Analysis Using VSOP Calculator Based on Zero-suppressed BDDs2005

    • 著者名/発表者名
      Sin-ichi Minato
    • 雑誌名

      Proc.of JSAI Workshop on Learning with Logics and Logics for Learning(LLLL) No.3

      ページ: 3-9

  • [雑誌論文] Finding Simple Disjoint Decompositions in Frequent Itemset Data Using Zero-suppressed BDD2005

    • 著者名/発表者名
      Sin-ichi Minato
    • 雑誌名

      Proc.of IEEE ICDM 2005 workshop on Computational Intelligence in Data Mining TRN2005-09

      ページ: 3-11

  • [雑誌論文] Efficient Combinatorial Item Set Analysis Based on Zero-Suppressed BDDs2005

    • 著者名/発表者名
      Sin-ichi Minato, Hiroki Arimura(H13-H16代表者)
    • 雑誌名

      Proc.of IEEE/IEICE/IPSJ International Workshop on Challenges in Web Information Retrieval and Integration IEEE CS P2414

      ページ: 3-10

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi