• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

大規模知識基盤形成のための次世代半構造マイニング技術の展開

Research Project

Project/Area Number 24240021
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977)
湊 真一  北海道大学, 情報科学研究科, 教授 (10374612)
伊藤 公人  北海道大学, 北海道大学人獣共通感染症リサーチセンター, 准教授 (60396314)
下薗 真一  九州工業大学, 情報工学研究院, 准教授 (70243988)
喜田 拓也  北海道大学, 情報科学研究科, 准教授 (70343316)
平田 耕一  九州工業大学, 情報工学研究院, 教授 (20274558)
Project Period (FY) 2012-04-01 – 2016-03-31
Keywords半構造マイニング / トラジェクトリ照合 / 群パターンマイニング / ZDD / 半構造マイニングエンジン / 部分超グラフ列挙
Research Abstract

本研究では,実世界と情報世界が融合した巨大な情報空間から有用な知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指す.平成25年度は,大規模知識基盤形成システムのための技術調査と,基盤技術の開発,環境整備について,次の項目に関して研究・開発を行う.
(1)最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発(有村・宇野・平田).大規模実世界データにおける知識発見の先端技術調査に基づき,従来の超高速パターン発見アルゴリズムを拡張し,非巡回超グラフの種々の部分族に対する理論的性能保障付きパターンマイニングアルゴリズムを開発した.(2)時空間情報を用いた半構造データマイニングの研究開発(有村・宇野・平田・下薗).2次元とそれ以上の次元の時空間パターンに対する多項式遅延・領域の高速なパターンマイニングアルゴリズムを開発した.(3)確率的情報スキーマと半構造データマイニングの結合の研究(喜田・伊藤・有村)無限関係モデルに文脈と背景知識を取り入れて,関係データからの統計マイニングアルゴリズムを開発した.(4)大規模知識基盤形成システムのための知識連係技術の研究開発(伊藤,平田,喜田,有村).トラジェクトリデータに対する高速パターン照合手法を開発した.(5)大規模知識基盤形成システムのための高速な知識索引技術の研究開発(湊,宇野,有村).ZDDを元に,巡回に拡張したπDD や,系列集合に拡張したSeqBDD 等の大規模知識索引の研究開発を行った.(6)知識基盤形成支援システムのプロトタイプ構築(全員).開発した知識発見技術を元に,実世界からの知識基盤形成システムのプロトタイプの構築を開始した.また,各研究項目に関して,随時,理論的な解析を元にさらなる最適化を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

(1)超高速半構造マイニングエンジンと研究開発に関しては,すでに目標を達成しつつある.具体的には,(1)では,非巡回超グラフの種々の部分族に対する多項式遅延・領域アルゴリズムの研究の大きな進展が見られ,(2)では,最近注目されるトラジェクトリデータ向けの「群れパターン」に対する世界初の多項式遅延・領域の閉パターン発見アルゴリズムの開発に成功している.また各種の高速化をおこなった.(4)知識連係技術では,トラジェクトリパターンの照合アルゴリズムについて,算術演算を最大限に活用した高速な手法の開発に成功し,学術雑誌に掲載された.(5)では,申請者と分担者らが先端を進んでいる高速な知識索引技術の研究開発で,知識索引の種々の半構造データへの拡張を進めることができた.他項目についても,(3)で統計的関係データ学習アルゴリズムを開発し,(6)で各項目で開発した理論的手法を実際に実装し,プロトタイプ構築のための計算機実験を行うなど,当初の計画以上に進展している.

Strategy for Future Research Activity

今後各項目ごとの研究開発の推進を一層進める,それと共に,本課題の最終的な目標である実世界と情報世界が融合した巨大な情報空間から知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指して,その理論的な枠組みや,個々の研究成果の統合,新たな研究課題と方向の策定を行っていきたい.いくつかの方向を示すと,(1)超高速半構造マイニングエンジンと研究開発に関しては,さまざまな木構造パターン発見技法を,超グラフ発見の枠で理論的に一般化し,ヘテロな巨大データからの知識発見の基盤技術を開発したい.(2)では,トラジェクトリデータ向けの高速知識発見手法をさらに追及し,時空間データを扱うための効率よい設計原理を明らかにし,同時に簡潔データ構造技術の進展もとりこみ,実用的で規模耐性の高い実装法を研究開発する.(4)知識連係技術では,これまでのハードウェアの算術演算を最大限に活用する超高速かつ低メモリアルゴリズム技法を,圧縮技術やパターン発見技術とつなげていきたい.(5)知識索引技術と統計的手法との融合では,開発した半構造データ向け技術の知識発見との連携がカギである.(6)プロトタイプ構築については,実装と解析を行っていく.

  • Research Products

    (28 results)

All 2014 2013

All Journal Article (7 results) (of which Peer Reviewed: 7 results) Presentation (21 results) (of which Invited: 5 results)

  • [Journal Article] Segmental Mapping and Distance between Rooted Labeled Ordered Trees2014

    • Author(s)
      Tomohiro Kan, Shoichi Higuchi, Kouichi Hirata
    • Journal Title

      Fundamenta Informaticae

      Volume: 未定(受理済み) Pages: 未定

    • Peer Reviewed
  • [Journal Article] Tractable and Intractable Variations of Unordered Tree Edit Distance2014

    • Author(s)
      Yoshiyuki Yamamoto, Kouichi Hirata, Tetsuji Kuboyama
    • Journal Title

      International Journal of Foundations of Computer Science

      Volume: 未定(受理済み) Pages: 未定

    • Peer Reviewed
  • [Journal Article] Constant Time Enumeration of Subtrees with Exactly k Nodes in a Tree2014

    • Author(s)
      Kunihiro Wasa, Yusaku Kaneta, Takeaki Uno, and Hiroki Arimura
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: Vol.E97-D, No.3 Pages: 421-430

    • Peer Reviewed
  • [Journal Article] A Compact and Fast Index Structure for Families of Sets2014

    • Author(s)
      Shuhei Denzumi, Jun Kawahara, Koji Tsuda, Hiroki Arimura, Shin-ichi Minato, and Kunihiko Sadakane
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 未定(受理済み) Pages: 未定

    • Peer Reviewed
  • [Journal Article] A Variable-length-to-fixed-length Coding Method Using a Re-Pair Algorithm2013

    • Author(s)
      Satoshi Yoshida and Takuya Kida
    • Journal Title

      IPSJ Transactions on Databases

      Volume: Vol. 6, No. 4 Pages: 17-23

    • Peer Reviewed
  • [Journal Article] Polynomial Delay and Space Discovery of Connected and Acyclic Sub-Hypergraphs in a Hypergraph2013

    • Author(s)
      Kunihiro Wasa, Takeaki Uno, Kouichi Hirata, and Hiroki Arimura
    • Journal Title

      Lecture Notes in Computer Science

      Volume: Vol.8140 Pages: 308-323

    • Peer Reviewed
  • [Journal Article] Faster Algorithms for Tree Similarity Based on Compressed Enumeration of Bounded-Sized Ordered Subtrees2013

    • Author(s)
      Kunihiro Wasa, Hiroki Arimura, Kouichi Hirata, and Takeaki Uno
    • Journal Title

      Lecture Notes in Computer Science

      Volume: Vol.8199 Pages: 73-84

    • Peer Reviewed
  • [Presentation] Direct Access to Variable-to-Fixed Length Codes with a Succinct Index2014

    • Author(s)
      Satoshi Yoshida, Hirohito Sasakawa, Kei Sekine, Takuya Kida
    • Organizer
      Data Compression Conference 2014 (DCC 2014), IEEE, poster
    • Place of Presentation
      Snowbird, Utah, USA
    • Year and Date
      20140326-20140328
  • [Presentation] Adaptive Dictionary Sharing Method for Re-Pair Algorithm2014

    • Author(s)
      Kei Sekine, Hirohito Sasakawa, Satoshi Yoshida, Takuya Kida
    • Organizer
      Data Compression Conference 2014 (DCC 2014), IEEE, poster
    • Place of Presentation
      Snowbird, Utah, USA
    • Year and Date
      20140326-20140328
  • [Presentation] Towards data assimilation of Malaria in Zambia2014

    • Author(s)
      Mayumbo Nyirenda, Hiroki Arimura, Kimihito Ito
    • Organizer
      Mathematical Science on Big Data Assimilation in Meteorology, poster
    • Place of Presentation
      Kyoto University, Kyoto
    • Year and Date
      20140319-20140321
  • [Presentation] 重み付きコスト関数による順序木編集距離2014

    • Author(s)
      山尾優幸, 芳野拓也, 島田昴治, 平田耕一
    • Organizer
      人工知能学会基本問題研究会(第93回)
    • Place of Presentation
      宮古島マリンターミナル大会議室,宮古市
    • Year and Date
      20140307-20140308
  • [Presentation] 超辺の縮約を許した非巡回部分超グラフの効率よい列挙2014

    • Author(s)
      和佐州洋,有村博紀,宇野毅明,平田耕一
    • Organizer
      第143回アルゴリズム研究会,IPSJ
    • Place of Presentation
      飯坂温泉伊勢谷, 福島市
    • Year and Date
      20140301-20140301
  • [Presentation] DAGによる文字列集合の圧縮表現に対する効率的な索引アルゴリズム2014

    • Author(s)
      伝住周平, 津田宏治, 有村博紀, 湊真一
    • Organizer
      人工知能学会 第92回人工知能基本問題研究会
    • Place of Presentation
      函館市民会館,函館市
    • Year and Date
      20140130-20140130
  • [Presentation] 大規模非構造データからの高速パターンマイニング:実世界からの知識発見へ向けて2013

    • Author(s)
      有村博紀
    • Organizer
      第26回情報伝送と信号処理ワークショップ,電子情報通信学会
    • Place of Presentation
      登別温泉第一滝本館,登別市
    • Year and Date
      20131113-20131113
    • Invited
  • [Presentation] Hierarchy of Segmental and Alignable Mapping for Rooted Labeled Trees2013

    • Author(s)
      Takuya Yoshino, Kouichi Hirata
    • Organizer
      Workshop on Data Discretization and Segmentation for Knowledge Discovery (DDS2013)
    • Place of Presentation
      Keio University, Kanagawa
    • Year and Date
      20131027-20131027
  • [Presentation] Agreement Subtree Mapping Kernel for Phylogenetic Trees2013

    • Author(s)
      Issei Hamada, Takaharu Shimada, Kouichi Hirata, Tetsuji Kuboyama
    • Organizer
      Workshop on Data Discretization and Segmentation for Knowledge Discovery (DDS2013)
    • Place of Presentation
      Keio University, Kanagawa
    • Year and Date
      20131027-20131027
  • [Presentation] Faster Broadword Pattern Matching Algorithms for Regular Expressions and Trees2013

    • Author(s)
      Hiroki Arimura
    • Organizer
      NII Shonan Meeting on Compact Data Structures for Big Data, NII
    • Place of Presentation
      Shonan Village Center, Zushi, Kanagawa
    • Year and Date
      20130927-20130930
    • Invited
  • [Presentation] Trajectory Pattern Mining in Practice - Algorithms for Mining Flock Patterns from Trajectories2013

    • Author(s)
      Xiaoliang Geng, Takeaki Uno and Hiroki Arimura
    • Organizer
      The 5th International Conference on Knowledge Discovery and Information Retrieval (IC3K KDIR`13)
    • Place of Presentation
      Hotel Vilamoura,ポルトガル
    • Year and Date
      20130919-20130922
  • [Presentation] BDD/ZDDを基盤とする離散構造処理系の最近の展開2013

    • Author(s)
      湊真一
    • Organizer
      電子情報通信学会 2013ソサイエティ大会
    • Place of Presentation
      福岡工業大学, 福岡市
    • Year and Date
      20130917-20130920
    • Invited
  • [Presentation] 大規模軌跡データからの群パターン発見のための実用的アルゴリズム2013

    • Author(s)
      耿 暁亮,宇野毅明, 有村博紀
    • Organizer
      第12回情報科学技術フォーラム(FIT2013)
    • Place of Presentation
      鳥取大学,鳥取市
    • Year and Date
      20130904-20130906
  • [Presentation] 大規模非構造データからの高速パターンマイニング~大規模・非定型な実世界データからの知識発見へ向けて~2013

    • Author(s)
      有村博紀
    • Organizer
      第4回ビッグデータと統計学研究集会
    • Place of Presentation
      北海道大学学術交流会館,札幌市
    • Year and Date
      20130903-20130903
    • Invited
  • [Presentation] Compact Complete Inverted Files for Texts and Directed Acyclic Graphs Based on Sequence Binary Decision Diagrams2013

    • Author(s)
      Shuhei Denzumi, Koji Tsuda, Hiroki Arimura and Shin-ichi Minato
    • Organizer
      Prague Stringology Conference 2013
    • Place of Presentation
      Czech Technical University, Prague
    • Year and Date
      20130902-20130904
  • [Presentation] A Dynamic Programming A* Algorithm for Computing Unordered Tree Edit Distance2013

    • Author(s)
      Takuya Yoshino, Shoichi Higuchi, Kouichi Hirata
    • Organizer
      IIAI International Conference on Advanced Applied Informatics (IIAI AAI 2013)
    • Place of Presentation
      Kunibiki Messe, Matsue
    • Year and Date
      20130831-20130904
  • [Presentation] Development of Flexible User Need's Investigation System Based on XML Conversions2013

    • Author(s)
      Masao Hattori, Keiichi Matsumoto, Noriko Sugimoto, Alireza Ahrary, Kouichi Hirata
    • Organizer
      IIAI International Conference on Advanced Applied Informatics (IIAI AAI 2013)
    • Place of Presentation
      Kunibiki Messe, Matsue
    • Year and Date
      20130831-20130903
  • [Presentation] 構造パターンの検索,学習,マイニング ~「かたち」から「意味」へ2013

    • Author(s)
      有村博紀
    • Organizer
      JSTさきがけ「知の創生」領域 第8回領域会議(領域統括 中島英之)
    • Place of Presentation
      能登ロイヤルホテル,石川県羽咋郡
    • Year and Date
      20130831-20130831
    • Invited
  • [Presentation] An Enumeration Problem of Connected and Acyclic Sub-hypergraphs in Hypergraphs2013

    • Author(s)
      Kunihiro Wasa, Takeaki Uno, Kouichi Hirata, and Hiroki Arimura
    • Organizer
      The 16th Japan-Korea Joint Workshop on Algorithms and Computation (WAAC 2013)
    • Place of Presentation
      Kyonggi University, Suwon, Korea
    • Year and Date
      20130712-20130714
  • [Presentation] Simple Variable-Length Encodings for GPS Trajectory Compression2013

    • Author(s)
      Hirohito Sasakawa, Hiroki Arimura
    • Organizer
      The 16th Japan-Korea Joint Workshop on Algorithms and Computation (WAAC 2013)
    • Place of Presentation
      Kyonggi University, Suwon, Korea
    • Year and Date
      20130712-20130714
  • [Presentation] On the hardness of approximating the minimum consistent DFA from prefix samples2013

    • Author(s)
      Kaori Ueno, Shinichi Shimozono, Kazuyuki Narisawa, and Ayumi Shinohara
    • Organizer
      The ICALP 2013 Satellite Workshop on Learning Theory and Complexity
    • Place of Presentation
      University of Latvia, Riga, Latvia
    • Year and Date
      20130707-20130707

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi