• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

知識基盤形成のための大規模半構造データからの超高速パターン発見

Research Project

Project/Area Number 17002008
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
湊 真一  北海道大学, 大学院・情報科学研究科, 助教授 (10374612)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 助教授 (60396314)
Keywords知識基盤形成 / 半構造データ / データマイニング / パターン発見 / 知識集約型技術 / 知識索引 / 極太パターン発見 / グラフマイニング
Research Abstract

本研究では,World Wide Web(WWW,ウェブ)に代表される膨大な電子情報に内在する知識を発見するための超高速半構造パターン発見技術と,これと組み合わせて知識基盤形成を行うための周辺技術の研究開発を行う.平成17年度は、次の項目に関して研究開発を行った.
(1)超高速半構造マイニングエンジンの研究として,分子生物学や時系列解析に広い応用をもつ極大モチーフ発見問題に対して,入力長の多項式遅延時間・多項式領域を達成する効率よい極大モチーフ列挙アルゴリズムMaxMotifを開発し,これにより生物情報学分野における未解決問題を肯定的に解決した.さらにその計算量を理論的に明らかにし,さらに,この枠組みを自明でないグラフの部分族に拡張し,属性木の族に対する多項式遅延多項式極大パターン発見アルゴリズムCLOATTを与えた(ISAAC'05,ILP'05).これにより,半構造データに対する性能保障をもつ高速な極大パターン発見が初めて可能になった(有村・喜田).また,統計的マイニングへの拡張として,開発したMaxMotifアルゴリズムを用いた高速な確率系列プロファイル発見手法を検討した(有村・伊藤).(2)半自動知識連係技術として,ネットワーク上の知識断片の相互連携のための知識獲得機構の検討を行った(Ito, IMKB XBVII).大規模知識基盤形成システムのための高速な知識索引技術として,分担者の湊が開発したZBDD技術に基づくタプル頻度表およびパターン頻度表を開発し(WIRI2006;信学会論文誌D, 53 (2)),圧縮して格納されたデータベース表現から,パターン頻度表として圧縮して表現された頻出パターン集合を直接計算する高速なアルゴリズムZBDD-growthを開発した.(3)知識獲得システムのプロトタイプ構築のために応用事例を調査し,要求要件を洗い出した.さらに,本年度の研究で開発したアルゴリズムを実装し,予備評価実験と理論的解析に基づいて最適化を行い,開発したプログラムの公開を行った(Unot, MaxMotif).知識基盤形成技術について,学術情報獲得や人獣共通感染症領域等の具体的領域に関して検討を行った(伊藤・喜田・有村).さらに,データ収集サーバを導入し,予備実験を行った(湊・伊藤・喜田・有村).

  • Research Products

    (14 results)

All 2006 2005

All Journal Article (12 results) (of which Peer Reviewed: 1 results) Book (2 results)

  • [Journal Article] A Meme Media Framework for Introducing Multimodal User Interface to Existing Web Applications2006

    • Author(s)
      Kimihito Ito
    • Journal Title

      Information Modelling And Knowledge Bases XVII

      Pages: 83-93

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] VSOP(Valued-Sum-of-products)Calculator for knowledge precessing Based on Zero-Suppressed BDDs2006

    • Author(s)
      S.Minato
    • Journal Title

      Federation over the Web LNAI 3847

      Pages: 40-58

  • [Journal Article] インフルエンザウイルスの抗原変異予測のためのコンピュータ解析2006

    • Author(s)
      伊藤公人
    • Journal Title

      人獣共通感染症リサーチセンター第一回学術講演会

  • [Journal Article] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • Author(s)
      Takuya Kida
    • Journal Title

      Proceedings of Dagstuhl Workshop on Federation over the Web LNAI3847

      Pages: 25-39

  • [Journal Article] 飽和集合列挙アルゴリズムを用いた大規模データベースからのルール発見手法2005

    • Author(s)
      宇野毅明, 有村博紀
    • Journal Title

      統計数理(統計数理研究所) 第53巻第2号

      Pages: 317-329

  • [Journal Article] ゼロサプレス型二分決定グラフを用いたトランザクションデータベースの効率的解析手法2005

    • Author(s)
      湊真一, 有村博紀
    • Journal Title

      電子情報通信学会論文誌D Vol.J89-D No.2

      Pages: 172-182

  • [Journal Article] A Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2005

    • Author(s)
      Hiroki Arimura, Takeaki Uno
    • Journal Title

      Proc.the 16th Annual International Symposium on Algorithmsand Computation(ISAAC'05) LNCS3827

      Pages: 724-737

  • [Journal Article] An Output-Polynomial Time Algorithm for Mining Frequent Closed Attribute Trees2005

    • Author(s)
      Hiroki Arimura, Takeaki Uno
    • Journal Title

      Proc.15th International Conference on Inductive Logic Programming(ILP'05) LNAI3625

      Pages: 1-19

  • [Journal Article] LCM ver.3 : Collaboration of Array, Bitmap and Prefix Tree for Frequent Itemset Mining2005

    • Author(s)
      Takeaki Uno, Masashi Kiyomi, Hiroki Arimura
    • Journal Title

      Proc.OSDM2005, in conjunction with ACM SIGKDD'05

  • [Journal Article] Key Semantics Extraction by Dependency Tree Mining2005

    • Author(s)
      S.Morinaga, H.Arimura, 他3名
    • Journal Title

      Proc.11th ACM SIGKDD Int'l Conf. Decompositons on Knowledge Discovery and Data Mining(KDD'05)

      Pages: 666-671

  • [Journal Article] Finding Simple Disjoint in Frequent Itemset Data Using Zero-suppressed BDD2005

    • Author(s)
      S.Minato
    • Journal Title

      Proc. of IEEE ICDM 2005 workshop on Computational Intelligence in Data Mining ISBN-0-97389 18-5-8

      Pages: 3-11

  • [Journal Article] Efficient Combinatorial Item Set Analysis Based on Zero-Suppressed BBDs2005

    • Author(s)
      S.Minato, H.Arimura
    • Journal Title

      Proc. IEEE/IEICE/IPSJ Int'l workshop on Challenges in Web Information Retrieval and Integration(WIRI-2005)

      Pages: 3-10

  • [Book] Special Issue on Algorithmic Learning Theory2005

    • Author(s)
      Sanjay Jain, Hiroki Arimura
    • Publisher
      Theoretical Computer Science, 348(1-2), Elsevier
  • [Book] 人工知能学辞典(小項目 「テキストマイニング」)((編)人工知能学会)2005

    • Author(s)
      有村博紀
    • Publisher
      共立出版

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi