• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

大規模知識基盤形成のための次世代半構造マイニング技術の展開

Research Project

Project/Area Number 24240021
Research Category

Grant-in-Aid for Scientific Research (A)

Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 喜田 拓也  北海道大学, 情報科学研究科, 准教授 (70343316)
湊 真一  北海道大学, 情報科学研究科, 教授 (10374612)
伊藤 公人  北海道大学, 人獣共通感染症センター, 准教授 (60396314)
宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977)
下薗 真一  九州工業大学, 情報工学研究院, 准教授 (70243988)
Project Period (FY) 2012-04-01 – 2016-03-31
Keywords半構造データ / データマイニング / ストリーム処理 / 大規模知識索引 / 知識発見 / 超低メモリアルゴリズム / イベント照合 / 知識索引
Research Abstract

本研究では,実世界と情報世界が融合した巨大な情報空間から有用な知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指す.平成24年度は,大規模知識基盤形成システムのための技術調査と,基盤技術の開発,環境整備について,次の項目に関して研究・開発を行う.
(1)最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発(有村・宇野・平田).大規模実世界データにおける知識発見の先端技術調査に基づき,従来の超高速パターン発見アルゴリズムを拡張し,限定サイズ部分木と非巡回超グラフの種々の部分族に対する理論的性能保障付きパターンマイニングアルゴリズムを開発した.(2)時空間情報を用いた半構造データマイニングの研究開発(有村・宇野・平田・下薗).2次元時空間パターンに対する多項式遅延・領域の高速なパターンマイニングアルゴリズムを開発した.(3)確率的情報スキーマと半構造データマイニングの結合の研究(喜田・伊藤・有村)無限関係モデルに文脈と背景知識を取り入れて,関係データからの統計マイニングアルゴリズムを開発した.(4)大規模知識基盤形成システムのための知識連係技術の研究開発(伊藤,平田,喜田,有村).ビット並列計算を用いた低メモリ超高速正規表現照合手法を,正規表現とXMLクエリ,複合イベントパターンの部分族に拡張し,ハードウェア実装技術を開発した.(5)大規模知識基盤形成システムのための高速な知識索引技術の研究開発(湊,宇野,有村).ZDDを元に,巡回に拡張したπDD や,系列集合に拡張したSeqBDD 等の大規模知識索引の研究開発を行った.(6)知識基盤形成支援システムのプロトタイプ構築(全員).開発した知識発見技術を元に,実世界からの知識基盤形成システムのプロトタイプの構築を開始した.また,各研究項目に関して,随時,理論的な解析を元にさらなる最適化を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

全体に,超高速半構造マイニングエンジンとその周辺技術の研究開発に関して,二年次以降の課題として挙げた研究項目について,予想以上の進展が得られ,すでに目標を達成しつつある.具体的には,(1)では,サイズ部分木と非巡回超グラフの種々の部分族に対する多項式遅延・領域アルゴリズムの研究の大きな進展が見られ,(2)では,最近注目されるトラジェクトリデータ向けの「群れパターン」に対する世界初の多項式遅延・領域の閉パターン発見アルゴリズムの開発に成功している.(4)知識連係技術では,正規表現と木パターンの照合アルゴリズムについて,ハードウェアの算術演算を最大限に活用して,現在の究極の時間計算量を達成する手法の開発に成功し,学術雑誌に掲載された.(5)では,申請者と分担者らが先端を進んでいる高速な知識索引技術の研究開発で,知識索引の種々の半構造データへの拡張を進めることができた.他項目についても,(3)で統計的関係データ学習アルゴリズムを開発し,(6)で各項目で開発した理論的手法を実際に実装し,プロトタイプ構築のための予備実験と解析を行っているなど,当初の計画以上に進展している.

Strategy for Future Research Activity

二年次以降は,各項目ごとの研究開発の推進を一層進める,それと共に,本課題の最終的な目標である実世界と情報世界が融合した巨大な情報空間から知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指して,その理論的な枠組みや,個々の研究成果の統合,新たな研究課題と方向の策定を行っていきたい.いくつかの方向を示すと,(1)超高速半構造マイニングエンジンと研究開発に関しては,さまざまな木構造パターン発見技法を,超グラフ発見の枠で理論的に一般化し,ヘテロな巨大データからの知識発見の基盤技術を開発したい.(2)では,トラジェクトリデータ向けの高速知識発見手法をさらに追及し,時空間データを扱うための効率よい設計原理を明らかにし,同時に簡潔データ構造技術の進展もとりこみ,実用的で規模耐性の高い実装法を研究開発する.(4)知識連係技術では,これまでのハードウェアの算術演算を最大限に活用する超高速かつ低メモリアルゴリズム技法を,圧縮技術やパターン発見技術とつなげていきたい.(5)知識索引技術と統計的手法との融合では,開発した半構造データ向け技術の知識発見との連携がカギである.(6)プロトタイプ構築については,実装と解析を行っていく.

  • Research Products

    (19 results)

All 2013 2012 Other

All Journal Article (5 results) Presentation (12 results) (of which Invited: 1 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Faster Bit-Parallel Algorithms for Unordered Pseudo-tree Matching and Tree Homeomorphism2012

    • Author(s)
      Yusaku Kaneta, Hiroki Arimura, and Rajeev Raman
    • Journal Title

      Journal of Discrete Algorithms

      Volume: Vol.14 Pages: 119-135

    • DOI

      doi:10.1016/j.jda.2011.12.018

  • [Journal Article] A Dynamically Reconfigurable FPGA-based Pattern Matching Hardware for Subclasses of Regular Expressions2012

    • Author(s)
      Yusaku Kaneta, Shingo Yoshizawa, Shin-ichi Minato, Hiroki Arimura, and Yoshikazu Miyanaga
    • Journal Title

      IEICE Trans. Inf. and Syst.

      Volume: Vol.E95-D, No.7 Pages: 1847-1857

  • [Journal Article] Counterexamples to the long-standing conjecture on the complexity of BDD binary operations2012

    • Author(s)
      Ryo Yoshinaka, Jun Kawahara, Shuhei Denzumi, Hiroki Arimura, and Shin-ichi Minato
    • Journal Title

      Information Procssing Letters

      Volume: Vol.112, Issue 16 Pages: 636-640

    • DOI

      10.1016/j.ipl.2012.05.007

  • [Journal Article] Improving Parse Trees for Efficient Variable-to-Fixed Length Codes2012

    • Author(s)
      Satoshi Yoshida, Takashi Uemura, Takuya Kida, Tatsuya Asai, and Seishi Okamoto
    • Journal Title

      Journal of Information Processing

      Volume: Vol.20, No.1 Pages: 238-249

  • [Journal Article] 長大な拡張文字列パターンに対する大規模文字列照合の高速化2012

    • Author(s)
      笹川 裕人, 金田 悠作, 有村博紀
    • Journal Title

      日本データベース学会論文誌 DBSJ Journal

      Volume: Vol.11, No.1 Pages: 55-60

  • [Presentation] Variable-to-Fixed-Length Encoding for Large Texts Using Re-Pair Algorithm with Shared Dictionaries2013

    • Author(s)
      Kei Sekine, Hirohito Sasakawa, Satoshi Yoshida, Takuya Kida
    • Organizer
      Proc. Data Compression Conference 2013 (DCC 2013), p.518, Snowbird, Utah, USA, March 2013
    • Place of Presentation
      The Cliff Lodge Convention Center (USA)
    • Year and Date
      20130301-20130301
  • [Presentation] Effective Variable-Length-to-Fixed-Length Coding via a Re-Pair Algorithm2013

    • Author(s)
      Satoshi Yoshida and Takuya Kida
    • Organizer
      Proc. of Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      The Cliff Lodge Convention Center (USA)
    • Year and Date
      20130301-20130301
  • [Presentation] Segmental Mapping and Distance for Rooted Labeled Ordered Trees2012

    • Author(s)
      Tomohiro Kan, Shoichi Higuchi, Kouichi Hirata
    • Organizer
      Proc. 23rd International Symposium on Algorithms and Computation (ISAAC 2012), Lecture Notes in Computer Science, Vol.7676, Springer, 485-494
    • Place of Presentation
      National Taiwan University (Taiwan)
    • Year and Date
      20121201-20121201
  • [Presentation] A Trim Distance between Positions in Nucleotide Sequences2012

    • Author(s)
      Shunsuke Makino, Takaharu Shimada, Kouichi Hirata, Kouki Yonezawa, Kimihito Ito
    • Organizer
      Proc. 15th International Conference on Discovery Science (DS2012), Lecture Notes in Computer Science 7569 Springer, 81-94
    • Place of Presentation
      Universite Lyon 2 (France)
    • Year and Date
      20121001-20121001
  • [Presentation] データマイニングにおける離散構造の列挙2012

    • Author(s)
      有村博紀
    • Organizer
      学習理論における組合せ論,研究集会
    • Place of Presentation
      九州大学 (福岡市)
    • Year and Date
      20120920-20120920
    • Invited
  • [Presentation] Trajectory Pattern Matching Based on Bit-Prallelism for Large GPS Data2012

    • Author(s)
      Hirohito Sasakawa, Hiroki Arimura
    • Organizer
      Proc. 3rd IIAI International Conference on e-Services and Knowledge Management (IIAI ESKM 2012) , pp.66-71, 2012
    • Place of Presentation
      九州大学 (福岡市)
    • Year and Date
      20120901-20120901
  • [Presentation] Pattern Mining from Trajectory GPS Data2012

    • Author(s)
      Xiaoliang Geng, Hiroki Arimura, Takeaki Uno
    • Organizer
      Proc. 3rd IIAI International Conference on e-Services and Knowledge Management (IIAI ESKM 2012) , pp.60-65, 2012
    • Place of Presentation
      九州大学 (福岡市)
    • Year and Date
      20120901-20120901
  • [Presentation] Analysis of Multiplexed Parse Trees for Almost Instantaneous VF codes2012

    • Author(s)
      Satoshi Yoshida and Takuya Kida
    • Organizer
      Proc. 3rd IIAI International Conference on e-Services and Knowledge Management (IIAI ESKM 2012), pp.36-41, 2012
    • Place of Presentation
      九州大学 (福岡市)
    • Year and Date
      20120901-20120901
  • [Presentation] Constant Time Enumeration of Bounded-Size Subtrees in Trees and Its Application2012

    • Author(s)
      Kunihiro Wasa, Yusaku Kaneta, Takeaki Uno, Hiroki Arimura
    • Organizer
      Proc. 18th Annual International Computing and Combinatorics Conference (COCOON2012), pp.347-359, Lecture Notes in Computer Science, Vol.7434, Springer, 2012
    • Place of Presentation
      Novotel Sydney on Darling Harbour (Australia)
    • Year and Date
      20120801-20120801
  • [Presentation] A Multiplexed Parse Tree for Almost Instantaneous VF Codes2012

    • Author(s)
      Satoshi Yoshida and Takuya Kida
    • Organizer
      Proc. the 15th Japan-Korea Joint Workshop on Algorithms and Computation (WAAC 2012), pp.1-8, 2012
    • Place of Presentation
      情報学研究所(東京都)
    • Year and Date
      20120710-20120711
  • [Presentation] Pattern Mining from Trajectory GPS Data2012

    • Author(s)
      Xiaoliang Geng, Hiroki Arimura, Takeaki Uno
    • Organizer
      Proc. the 15th Japan-Korea Joint Workshop on Algorithms and Computation (WAAC 2012), pp.60-65, 2012
    • Place of Presentation
      情報学研究所(東京都)
    • Year and Date
      20120710-20120711
  • [Presentation] Hiroki Arimura : A Bit-Parallel Multi-Resolution Pattern Matching Algorithm for GPS Trajectories2012

    • Author(s)
      Hirohito Sasakawa
    • Organizer
      Proc. the 15th Japan-Korea Joint Workshop on Algorithms and Computation (WAAC 2012), pp.1-8, 2012
    • Place of Presentation
      情報学研究所(東京都)
    • Year and Date
      20120710-20120711
  • [Book] 基礎から学ぶ情報理論2012

    • Author(s)
      中村 篤祥, 喜田 拓也, 湊 真一
    • Total Pages
      211
    • Publisher
      ムイスリ出版
  • [Remarks] Publications: Hiroki Arimura

    • URL

      http://www-ikn.ist.hokudai.ac.jp/~arim/publication.html

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi