• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

大規模知識基盤形成のための次世代半構造マイニング技術の研究

Research Project

Project/Area Number 20240014
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 喜田 拓也  北海道大学, 大学院・情報科学研究科, 准教授 (70343316)
湊 真一  北海道大学, 大学院・情報科学研究科, 教授 (10374612)
伊藤 公人  北海道大学, 人獣共通感染症リサーチセンター, 准教授 (60396314)
宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977)
平田 耕一  九州工業大学, 情報工学研究院, 准教授 (20274558)
Keywords半構造マイニング / 頻出パターン発見 / エピソードマイニング / 大規模知識索引 / グラフマイニング / ストリーム処理 / 極大パターン発見 / 知識発見
Research Abstract

本研究においては,ネットワーク上の大規模半構造データに内在する知識をパターンや規則としてとりだすことが可能な超高速な半構造マイニングエンジン技術を開発し,これを現実の多様な半構造データに適用するための周辺技術を開発する.さらに,開発した基盤技術と周辺技術の実装を行い,インターネット上の大規模半構造データからの知識発見実験を行うことを目的とする.
平成22年度は,これまでの成果を元に,大規模知識基盤形成システムのための基盤と応用技術の開発と,その理論解析,最適化を行う.具体的には,次の項目に関して研究・開発を行った.
(1)超高速半構造マイニングエンジンの研究開発として,菱形と多部エピソードの族に対する深さ優先頻出エピソード発見手法の開発と解析を行った.(2)確率的情報処理スキーマと半構造データマイニングの結合として,根付き木構造上の確率モデルに対するEMアルゴリズムと確率的刈込み接尾辞木を用いた系列予測手法を開発し,感染症の流行解析やスパムフィルタリングの実証実験を行った.(3)半構造データマイニングの一般理論の構築.効率よくマイニング可能なエピソードのクラスの特徴付けとアルゴリズム構成法を与えた.(4)知識連係技術の研究開発として,半構造ストリーム照合手法のハードウェア上の超高速実装方法や,圧縮パターン照合技術の開発を行った.(5)高速な知識索引技術の研究開発.大規模系列集合のためのZBDDに基づく大規模知識索引技術を開発した.(6)知識基盤形成支援システムのプロトタイプ構築.上記のアルゴリズムを実装し,評価実験を行った,一連の研究に関し,2010年信学会情報・システムソサイエティ論文賞(湊,有村,2010.06,01),情報処理学会平成22年度IPSJ論文船井若手奨励賞(Katoh他,2011.03.25),情報処理学会平成22年度山下記念研究賞(柳橋,2010.05.22)等を受賞した.

  • Research Products

    (17 results)

All 2011 2010 Other

All Journal Article (9 results) (of which Peer Reviewed: 9 results) Presentation (7 results) Remarks (1 results)

  • [Journal Article] On Performance of Compressed Pattern Matching on VF Codes2011

    • Author(s)
      Satoshi Yoshida, Takuya Kida
    • Journal Title

      Proc. of Data Compression Conference 2011

      Volume: IEEE DCC11 Pages: 486

    • Peer Reviewed
  • [Journal Article] Unsupervised Spam Detection by Document Probability Estimation with Maximal Overlap Method2010

    • Author(s)
      T. Uemura, D. Ikeda, T. Kida, H. Arimura
    • Journal Title

      Transactions of the Japanese Society for Artificial Intelligence

      Volume: Vol.26 Pages: 297-306

    • Peer Reviewed
  • [Journal Article] 分節木と共用文字列で表現される符号上での効率良い圧縮照合アルゴリズム2010

    • Author(s)
      喜田拓也
    • Journal Title

      電子情報通信学会和文論文誌

      Volume: Vol.J93-D Pages: 733-741

    • Peer Reviewed
  • [Journal Article] An Efficient Depth-first Search Algorithm for Extracting Frequent Diamond Episodes from Event Sequences2010

    • Author(s)
      Takashi Katoh, Hiroki Arimura, Kouichi Hirata
    • Journal Title

      IPSJ Online Transactions

      Volume: Vol.3 Pages: 1-12

    • Peer Reviewed
  • [Journal Article] Dynamic Reconfigurable Bit-Parallel Architecture for Large-Scale Regular Expression Matching2010

    • Author(s)
      Yusaku Kaneta, Shin-ichi Minato, Hiroki Arimura, 他2名
    • Journal Title

      Proc. the 2010 IEEE International Conference on Field-Programmable Technology

      Volume: IEEE FPT10 Pages: 21-28

    • Peer Reviewed
  • [Journal Article] Frequentness-Transition Queries for Distinctive Pattern Mining from Time-Segmented Databases2010

    • Author(s)
      Shin-ichi Minato, Takeaki Uno
    • Journal Title

      Proc. SIAM International Conference on Data Mining, SDM 2010

      Volume: SIAM DM'10 Pages: 339-349

    • Peer Reviewed
  • [Journal Article] Fast Bit-Parallel Matching for Network and Regular Expressions2010

    • Author(s)
      Yusaku Kaneta, Shin-ichi Minato, Hiroki Arimura
    • Journal Title

      Proc. the 17th Symposium on String Processing and Information Retrieval (SPIRE2010)

      Volume: LNCS 6393 Pages: 372-384

    • Peer Reviewed
  • [Journal Article] Faster Bit-Parallel Algorithms for Unordered Pseudo-tree Matching and Tree Homeomorphism2010

    • Author(s)
      Yusaku Kaneta, Hiroki Arimura
    • Journal Title

      Proc. 21st International Workshop on Combinatorial Algorithms (IWOCA2010)

      Volume: LNCS 6460 Pages: 68-81

    • Peer Reviewed
  • [Journal Article] Aligned Bipartite Episodes Between the Genera of Bacteria2010

    • Author(s)
      Takashi Katoh, Kouichi Hirata, Hiroki Arimura, 他2名
    • Journal Title

      Proc. 2010 IEEE/ICME International Conference on Complex Medical Engineering (CME'10)

      Volume: IEEE/ICME CME10 Pages: 193-197

    • Peer Reviewed
  • [Presentation] オンラインXMLストリーム処理のための効率良い木正規表現パターン照合アルゴリズム2011

    • Author(s)
      藤兼靖之, 金田悠作, 有村博紀
    • Organizer
      電子情報通信学会2011総合大会,予稿集
    • Place of Presentation
      オンライン
    • Year and Date
      20110300
  • [Presentation] Efficient Multiple Regular Expression Matching on FPGAs based on Extended SHIFT-AND Method2010

    • Author(s)
      Yusaku Kaneta, Shin-ichi Minato, Hiroki Arimura
    • Organizer
      Proc. the 16th Workshop on Synthesis And System Integration of Mixed Information Technologies
    • Place of Presentation
      Taipei
    • Year and Date
      20101018-20101019
  • [Presentation] VF符号と算術符号の組合せ手法による圧縮率向上について2010

    • Author(s)
      吉田諭史, 喜田拓也
    • Organizer
      情報処理学会第150回DBS研究会・第99回SIG-IFAT研究会合同研究発表会,Vol.2010-IFAT-99 No.10
    • Place of Presentation
      東京
    • Year and Date
      20100800
  • [Presentation] 非巡回正規表現に対する効率的なパターン照合2010

    • Author(s)
      金田悠作, 湊真一, 有村博紀
    • Organizer
      コンピュテーション研究会,電子情報通信学会,COMP
    • Place of Presentation
      北陸先端大
    • Year and Date
      20100500
  • [Presentation] A Combination of Variable-length-to-Fixed-length Coding with Arithmetic Coding for Efficient Compression and Pattern Matching2010

    • Author(s)
      Satoshi Yoshida, Takuya Kida
    • Organizer
      5th Workshop on Compression, Text, and Algorithms (WCTA'10)
    • Place of Presentation
      Los Cabos, Mexico
    • Year and Date
      2010-10-14
  • [Presentation] Large-scale Pattern Matching on Reconfigurable Hardware2010

    • Author(s)
      Yusaku Kaneta, Hiroki Arimura
    • Organizer
      5th Workshop on Compression, Text, and Algorithms (WCTA'10)
    • Place of Presentation
      Los Cabos, Mexico
    • Year and Date
      2010-10-14
  • [Presentation] Efficient Algorithms for Discovering Frequent and Maximal Substructures from Large Semistructured Data2010

    • Author(s)
      Hiroki Arimuraa
    • Organizer
      Proc. 25th Int'l Symp. on Computer & Info. Sciences (ISCIS' 10), Lecture Notes in Electrical Engineering, Vol.62, Springer, 353-358(invited)
    • Place of Presentation
      London, UK
    • Year and Date
      2010-09-25
  • [Remarks]

    • URL

      http://www-ikn.ist.hokudai.ac.jp/~arim/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi