• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

知識基盤形成のための大規模半構造データからの超高速パターン発見

Research Project

Project/Area Number 17002008
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  Hokkaido University, 大学院・情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 喜田 拓也  北海道大学, 大学院・情報科学研究科, 准教授 (70343316)
湊 真一  北海道大学, 大学院・情報科学研究科, 准教授 (10374612)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 准教授 (60396314)
Keywords知識基盤形成 / 半構造データ / データマイニング / パターン発見 / 知識集約型技術 / 知識索引 / 情報抽出
Research Abstract

本研究では,WWW(ウェブ)などの大規模半構造データからの知識基盤形成のための超高速半構造パターン発見技術とその周辺技術の研究開発を行う.平成19年度は,次の項目に関して研究開発を行った.
(1)超高速半構造マイニングエンジンの研究として,さまざまな知識発見問題に対して,性能保障をもつ効率よいパターン発見アルゴリズムを開発した.特に幾何グラフや近似アイテム集合,伸張を許す極大系列パターン等の半構造データ族に対して,効率よい多項式時間遅延・多項式領域アルゴリズムを開発した.統計的マイニングに関して,特に人獣共通感染症領域における遺伝子解析応用を想定して,新しい情報量的基準を導入し,これを最適化する効率よいパターン発見手法を開発した.また,本研究で開発した高速大規模データマイニング技術に関する基本技法の解説を執筆した(有村,伊藤,喜田)
(2)大規模知識基盤形成システムのための高速な知識索引技術として,ZBDD技術を用いた圧縮知識索引機構と,その上で対称パターンの発見や,飽和集合発見を行う高速アルゴリズムを開発した.さらに,高効率知識索引構築のための基礎技術として,回路最適化技術を知識発見に応用し変数順序最適化法を開発した(湊,喜田,有村)
(3)半自動知識連係技術として,ネットワークからの情報抽出や高速半構造ストリーム処理に基づく効率よい情報収集技術を開発した.このために,半構造データに対する例と質問からの機械学習技術や,ビット並列手法に基づく多次元数値ストリームデータに対する複雑な時系列パターン照合技術を開発した.(伊藤,喜田,有村)
(4)開発した知識発見・知識連携・知識索引技術に関して,これまでのアルゴリズム実装と,評価実験,理論的解析に基づき,知識発見ツールの集合として知識獲得プロトタイプシステムを構築した.知識基盤形成技術について,ウェブからの情報収集や人獣共通感染症領域等で適用を行った(湊・伊藤・喜田・有村)これらに関して,インフルエンザ予測における知識獲得技術応用が新聞記事に取り上げられた(2006年11月07日付日経産業新聞,2008年3月26日付朝日新聞(北海道)

  • Research Products

    (14 results)

All 2008 2007

All Journal Article (12 results) (of which Peer Reviewed: 12 results) Presentation (2 results)

  • [Journal Article] Genetically destined potentials for N-linked glycosylation associated with antigenic changes of influenza virus hemagglutinin2008

    • Author(s)
      Igarashi, M., Ito, K., Kida, H., Takada, A.
    • Journal Title

      Virology (In press)

    • Peer Reviewed
  • [Journal Article] ウェブ閲覧における効率的なキーワード抽出とその利用2008

    • Author(s)
      上村卓史・喜田拓也・有村博紀
    • Journal Title

      情報処理学会論文誌:データベース(TOD) Vol.38(In press)

    • Peer Reviewed
  • [Journal Article] Frequent Closed Item Set Mining Based on Zero-suppressed BDDs2007

    • Author(s)
      S. Minato, H. Arimura
    • Journal Title

      Information and Media Technologies(IMT) Vol.2

      Pages: 309-316

    • Peer Reviewed
  • [Journal Article] Hardness results on local multiple alignment of biological sequences2007

    • Author(s)
      T. Akutsu, H. Arimura, S. Shimozono
    • Journal Title

      IPSJ Trans.on Bioinformatics Vol.48

      Pages: 30-38

    • Peer Reviewed
  • [Journal Article] データインテンシブコンピューティングその2-頻出アイテム集合発見アルゴリズム-2007

    • Author(s)
      宇野毅明・有村博紀
    • Journal Title

      人工知能学会誌 Vol.22

      Pages: 425-436

    • Peer Reviewed
  • [Journal Article] プロパティ接尾辞木のオフライン線形時間構築アルゴリズム2007

    • Author(s)
      上村卓史・喜田拓也・有村博紀
    • Journal Title

      電子情報通信学会論文誌 Vol.J91-D

      Pages: 595-607

    • Peer Reviewed
  • [Journal Article] Time and Space Efficient Discovery of Maximal Geometric Graphs2007

    • Author(s)
      H. Arimura, T. Uno, et. al.
    • Journal Title

      Lecture Notes in Computer Science Vol.4755

      Pages: 219-230

    • Peer Reviewed
  • [Journal Article] An Efficient Polynomial Delay Algorithm for Pseudo Frequent Itemset Mining2007

    • Author(s)
      T. Uno, H. Arimura
    • Journal Title

      Lecture Notes in Computer Science Vol.4755

      Pages: 42-55

    • Peer Reviewed
  • [Journal Article] Mining Maximal Flexible Patterns in Sequence2007

    • Author(s)
      H. Arimura, T. Uno
    • Journal Title

      Lecture Notes in Computer Science Vol.4914

      Pages: 307-317

    • Peer Reviewed
  • [Journal Article] A Theoretical Study on Variable Ordering of Zero-suppressed BDDs for Representing Frequent Itemsets2007

    • Author(s)
      S, Minato
    • Journal Title

      Lecture Notes in Computer Science Vol.4914

      Pages: 139-150

    • Peer Reviewed
  • [Journal Article] Frequent Pattern Mining and Knowledge Indexing Based on Zero-suppressed BDDs2007

    • Author(s)
      S. Minato, H. Arimura
    • Journal Title

      Lecture Notes in Computer Science Vol.4747

      Pages: 152-169

    • Peer Reviewed
  • [Journal Article] Efficient Algorithms for Finding Frequent Substructures from Semi-structured Data Streams2007

    • Author(s)
      T. Asai, K. Abe, S. Kawasoe, H. Arimura, S. Arikawa
    • Journal Title

      Lecture Notes in Computer Science Vol.3609

      Pages: 29-45

    • Peer Reviewed
  • [Presentation] ブラウジング支援のための一覧性の高いキーワードリストの抽出2008

    • Author(s)
      上村卓史・喜田拓也・有村博紀
    • Organizer
      情報処理学会第70回全国大会
    • Place of Presentation
      筑波
    • Year and Date
      2008-03-14
  • [Presentation] An Efficient Algorithm for Complex Pattern Matching over Continuous Data Streams Based on Bit-Parallel Method2007

    • Author(s)
      T. Saito, T. Kida, H. Arimura
    • Organizer
      The Third IEEE International Workshop on Data bases for Next-Generation Researchers (SWOD'07)
    • Place of Presentation
      Istanbul,Turkey
    • Year and Date
      2007-04-15

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi