• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

知識基盤形成のための大規模半構造データからの超高速パターン発見

Research Project

Project/Area Number 17002008
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 大学院情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 喜田 拓也  北海道大学, 大学院情報科学研究科, 助教授 (70343316)
湊 真一  北海道大学, 大学院情報科学研究科, 助教授 (10374612)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 助教授 (60396314)
Keywords知識基盤形成 / 半構造データ / データマイニング / パターン発見 / 知識集約型技術 / 知識索引構造
Research Abstract

本研究では,World Wide Web (WWW,ウェブ)に代表される膨大な電子情報に内在する知識を発見するための超高速半構造パターン発見技術と,これと組み合わせて知識基盤形成を行うための周辺技術の研究開発を行う.平成18年度は,次の項目に関して研究開発を行った.
(1)超高速半構造マイニングエンジンの研究として,さまざまな知識発見問題に広い応用をもつ極大モチーフ発見問題に対して,入力長の多項式遅延時間・多項式領域を達成する効率よい極大パターン発見アルゴリズムを開発した.特に,前年度に開発した極大系列モチーフ発見手法MaxMotifの計算量を理論的に明らかにし,学術論文として出版した.さらに,この枠組みを2次元極大パターンや伸張を許す極大系列パターンの族に拡張した.これにより,2次元データや柔軟な系列データなどより広い族の半構造データに対する性能保障をもつ高速な極大パターン発見が可能になった(有村・喜田).また,統計的マイニングヘの拡張として,重み付き極大パターン発見と統計的機械学習を用いた高速な確率的な知識発見手法を検討した(有村・伊藤・喜田).
(2)半自動知識連係技術として,ネットワーク上の知識断片の巡回用いた情報収集機構の検討を行った(Tsutsui, Ito, Arimura, DEWS2007).大規模知識基盤形成システムのための高速な知識索引技術として,前年度に開発したZBDD技術を用いた知識索引機構上で,圧縮して格納されたデータベース表現から,パターンの単純分解構造や,在的な対称パターンの発見,系列パターン発見を行う高速アルゴリズムや,パターン頻度表として圧縮して表現された閉パターン集合を直接計算するアルゴリズムを開発した(湊,喜田,有村).また,半構造ストリーム処理の研究を行った(有村・喜田).
(3)知識獲得システムのプロトタイプ構築のために応用事例を調査し,要求要件を洗い出した.査前年度に引き続いて開発したアルゴリズムを実装し,評価実験と理論的解析に基づき最適化を行い,公開した.知識基盤形成技術について,学術情報獲得や人獣共通感染症領域等の具体的領域に関して検討を行った.さらに,データ収集サーバを導入し,予備実験を行った(湊・伊藤・喜田・有村).

  • Research Products

    (13 results)

All 2007 2006

All Journal Article (11 results) (of which Peer Reviewed: 4 results) Book (2 results)

  • [Journal Article] N-gram Analysis Based on Zero-suppressed BDDs2007

    • Author(s)
      Shin-ichi Minato
    • Journal Title

      Lecture Notes in Computer Science Vol. 4384

      Pages: 289-300

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] An Efficient Algorithm for Complex Pattern Matching over Continuous Data Streams Based on Bit-Parallel Method2007

    • Author(s)
      Tomoya Saito, Takuya Kida, Hiroki Arimura
    • Journal Title

      The Third IEEE International Workshop on Databases for Next-Generation Researchers (SWOD'07)

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] An Efficient Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2007

    • Author(s)
      Hiroki Arimura, Takeaki Uno
    • Journal Title

      Journal of Combinatorial Optimization Vol.13

      Pages: 243-262

  • [Journal Article] Frequent Closed Item Set Mining Based on Zero-suppressed BDDs2007

    • Author(s)
      Shin-ichi Minato, Hiroki Arimura
    • Journal Title

      Information and Media Technologies (IMT) Vo1.2, No.1

      Pages: 309-316

  • [Journal Article] Symmetric Item Set Mining Method Using Zero-suppressed BDDs and Application to Biological Data2007

    • Author(s)
      Shin-ichi Minato, Kimihito Ito
    • Journal Title

      Information and Media Technologies (IMT) Vol.2

      Pages: 300-308

  • [Journal Article] Hardness results on local multiple alignment of biological sequences2007

    • Author(s)
      Tatsuya Akutsu, Hiroki Arimura, Shinichi Shimozono
    • Journal Title

      IPSJ Transactions on Bioinformatics Vol.48, No.SIG 5(TBIO)

      Pages: 30-38

  • [Journal Article] Compiling Bayesian Networks by Symbolic Probability Calculation Based on Zero-suppressed BDDs2007

    • Author(s)
      S.Minato, K.Satoh, T.Sato
    • Journal Title

      In Proc. of 20th International Joint Conference of Artificial Intelligence (IJCAI-2007)

      Pages: 2550-2555

  • [Journal Article] A Method of Variable Ordering for Zero-suppressed Binary Decision Diagrams in Data Mining Applica2007

    • Author(s)
      H.Iwasaki, S.Minato, T.Zeugmann
    • Journal Title

      The Third IEEE International Workshop on Databases for Next-Generation Researchers (SWOD'07)

  • [Journal Article] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • Author(s)
      Takuya Kida
    • Journal Title

      Lecture Notes in Computer Science Vol. 3847

      Pages: 25-39

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Efficient Database Analysis Using VSOP Calculator Based on Zero-suppressed BDDs2006

    • Author(s)
      Shin-ichi Minato
    • Journal Title

      Lecture Notes in Computer Science Vol. 4012

      Pages: 169-181

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] 単語幅を制約した接尾辞木の効率のよい構築アルゴリズム2006

    • Author(s)
      上村卓史, 喜田拓也, 有村博紀
    • Journal Title

      情報科学技術レターズ,電子情報通信学会情報処理学会

      Pages: LA-002

  • [Book] Computational Challenges of Massive Data Sets and Randomness in Computa, Special Issue on the First and SecondJapanese-German Frontiers of Science Symposia, Journal of Universal Computer Sci., Vol. 12,issue 62006

    • Author(s)
      Jorg Rothe, Hiroki Arimura
    • Total Pages
      182
    • Publisher
      Journal of Universal Computer Science
  • [Book] Proceedings of Int'l Workshop on Data Mining and Statistical Science (DMSS-2006)2006

    • Author(s)
      H.Arimura, T.Washio, K.Satoh, T.Higuchi, K.Ito, S.Hirano
    • Total Pages
      225
    • Publisher
      DMSS2006

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi