• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

知識基盤形成のための大規模半構造データからの超高速パターン発見

研究課題

研究課題/領域番号 17002008
研究機関北海道大学

研究代表者

有村 博紀  北海道大学, 大学院情報科学研究科, 教授 (20222763)

研究分担者 喜田 拓也  北海道大学, 大学院情報科学研究科, 助教授 (70343316)
湊 真一  北海道大学, 大学院情報科学研究科, 助教授 (10374612)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 助教授 (60396314)
キーワード知識基盤形成 / 半構造データ / データマイニング / パターン発見 / 知識集約型技術 / 知識索引構造
研究概要

本研究では,World Wide Web (WWW,ウェブ)に代表される膨大な電子情報に内在する知識を発見するための超高速半構造パターン発見技術と,これと組み合わせて知識基盤形成を行うための周辺技術の研究開発を行う.平成18年度は,次の項目に関して研究開発を行った.
(1)超高速半構造マイニングエンジンの研究として,さまざまな知識発見問題に広い応用をもつ極大モチーフ発見問題に対して,入力長の多項式遅延時間・多項式領域を達成する効率よい極大パターン発見アルゴリズムを開発した.特に,前年度に開発した極大系列モチーフ発見手法MaxMotifの計算量を理論的に明らかにし,学術論文として出版した.さらに,この枠組みを2次元極大パターンや伸張を許す極大系列パターンの族に拡張した.これにより,2次元データや柔軟な系列データなどより広い族の半構造データに対する性能保障をもつ高速な極大パターン発見が可能になった(有村・喜田).また,統計的マイニングヘの拡張として,重み付き極大パターン発見と統計的機械学習を用いた高速な確率的な知識発見手法を検討した(有村・伊藤・喜田).
(2)半自動知識連係技術として,ネットワーク上の知識断片の巡回用いた情報収集機構の検討を行った(Tsutsui, Ito, Arimura, DEWS2007).大規模知識基盤形成システムのための高速な知識索引技術として,前年度に開発したZBDD技術を用いた知識索引機構上で,圧縮して格納されたデータベース表現から,パターンの単純分解構造や,在的な対称パターンの発見,系列パターン発見を行う高速アルゴリズムや,パターン頻度表として圧縮して表現された閉パターン集合を直接計算するアルゴリズムを開発した(湊,喜田,有村).また,半構造ストリーム処理の研究を行った(有村・喜田).
(3)知識獲得システムのプロトタイプ構築のために応用事例を調査し,要求要件を洗い出した.査前年度に引き続いて開発したアルゴリズムを実装し,評価実験と理論的解析に基づき最適化を行い,公開した.知識基盤形成技術について,学術情報獲得や人獣共通感染症領域等の具体的領域に関して検討を行った.さらに,データ収集サーバを導入し,予備実験を行った(湊・伊藤・喜田・有村).

  • 研究成果

    (13件)

すべて 2007 2006

すべて 雑誌論文 (11件) (うち査読あり 4件) 図書 (2件)

  • [雑誌論文] N-gram Analysis Based on Zero-suppressed BDDs2007

    • 著者名/発表者名
      Shin-ichi Minato
    • 雑誌名

      Lecture Notes in Computer Science Vol. 4384

      ページ: 289-300

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] An Efficient Algorithm for Complex Pattern Matching over Continuous Data Streams Based on Bit-Parallel Method2007

    • 著者名/発表者名
      Tomoya Saito, Takuya Kida, Hiroki Arimura
    • 雑誌名

      The Third IEEE International Workshop on Databases for Next-Generation Researchers (SWOD'07)

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] An Efficient Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2007

    • 著者名/発表者名
      Hiroki Arimura, Takeaki Uno
    • 雑誌名

      Journal of Combinatorial Optimization Vol.13

      ページ: 243-262

  • [雑誌論文] Frequent Closed Item Set Mining Based on Zero-suppressed BDDs2007

    • 著者名/発表者名
      Shin-ichi Minato, Hiroki Arimura
    • 雑誌名

      Information and Media Technologies (IMT) Vo1.2, No.1

      ページ: 309-316

  • [雑誌論文] Symmetric Item Set Mining Method Using Zero-suppressed BDDs and Application to Biological Data2007

    • 著者名/発表者名
      Shin-ichi Minato, Kimihito Ito
    • 雑誌名

      Information and Media Technologies (IMT) Vol.2

      ページ: 300-308

  • [雑誌論文] Hardness results on local multiple alignment of biological sequences2007

    • 著者名/発表者名
      Tatsuya Akutsu, Hiroki Arimura, Shinichi Shimozono
    • 雑誌名

      IPSJ Transactions on Bioinformatics Vol.48, No.SIG 5(TBIO)

      ページ: 30-38

  • [雑誌論文] Compiling Bayesian Networks by Symbolic Probability Calculation Based on Zero-suppressed BDDs2007

    • 著者名/発表者名
      S.Minato, K.Satoh, T.Sato
    • 雑誌名

      In Proc. of 20th International Joint Conference of Artificial Intelligence (IJCAI-2007)

      ページ: 2550-2555

  • [雑誌論文] A Method of Variable Ordering for Zero-suppressed Binary Decision Diagrams in Data Mining Applica2007

    • 著者名/発表者名
      H.Iwasaki, S.Minato, T.Zeugmann
    • 雑誌名

      The Third IEEE International Workshop on Databases for Next-Generation Researchers (SWOD'07)

  • [雑誌論文] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • 著者名/発表者名
      Takuya Kida
    • 雑誌名

      Lecture Notes in Computer Science Vol. 3847

      ページ: 25-39

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] Efficient Database Analysis Using VSOP Calculator Based on Zero-suppressed BDDs2006

    • 著者名/発表者名
      Shin-ichi Minato
    • 雑誌名

      Lecture Notes in Computer Science Vol. 4012

      ページ: 169-181

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] 単語幅を制約した接尾辞木の効率のよい構築アルゴリズム2006

    • 著者名/発表者名
      上村卓史, 喜田拓也, 有村博紀
    • 雑誌名

      情報科学技術レターズ,電子情報通信学会情報処理学会

      ページ: LA-002

  • [図書] Computational Challenges of Massive Data Sets and Randomness in Computa, Special Issue on the First and SecondJapanese-German Frontiers of Science Symposia, Journal of Universal Computer Sci., Vol. 12,issue 62006

    • 著者名/発表者名
      Jorg Rothe, Hiroki Arimura
    • 総ページ数
      182
    • 出版者
      Journal of Universal Computer Science
  • [図書] Proceedings of Int'l Workshop on Data Mining and Statistical Science (DMSS-2006)2006

    • 著者名/発表者名
      H.Arimura, T.Washio, K.Satoh, T.Higuchi, K.Ito, S.Hirano
    • 総ページ数
      225
    • 出版者
      DMSS2006

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi