• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

大規模実世界時空間データストリーム処理のための超高速な検索・発見技術の研究

Research Project

Project/Area Number 15K12022
Research InstitutionHokkaido University

Principal Investigator

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) トーマス ツォイクマン  北海道大学, 情報科学研究科, 教授 (60374609)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords情報検索 / データマイニング / ストリームデータ処理 / 大規模知識処理 / QBFソルバー / 多重性 / 文脈性
Outline of Annual Research Achievements

本研究では,多様で膨大な実世界時空間ストリームデータに対する高速大規模処理の基盤技術として,複雑なパターンに対する検索・計数・発見技術を中心に研究開発する.とくに,アルゴリズムの高速性と低メモリ性に加えて,実世界時空間ストリーム処理の特性に対応して,適応性・文脈性・多重性をもつアルゴリズムの開発に焦点を当てて研究した.最終年度のプロトタイプシステム構築を目指して,各テーマごとに,アルゴリズム開発と,理論解析,実装評価を並行して進めた.具体的には,研究期間全体では,次の5つの分担研究項目の研究を行った.(A1) ビット並列技法を用いた超高速実世界ストリーム検索技術の研究開発(有村)(A2) 確率的近似検査法に基づく超高速実世界ストリーム計数技術の研究開発(ジョーダン,有村)(A3) 構造列挙手法に基づく超高速実世界ストリーム発見技術の研究開発(有村・ジョーダン)(A4) 超高速ストリーム知識発見の理論的基盤の研究(ツォイグマン,有村)(B1) プロトタイプシステム構築と予備評価実験.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度は,各項目について次のように研究を推進した.(A1) K本の成長し続けるイベントストリームに対して,その部分系列の出現と計数を管理する系列索引の線形時間構築アルゴリズムを開発した(Takagi et al., CPM 2016).さらに,接尾辞木自体の検索を高速化するために,ビット並列技法を用いた亜線形時間(sublinear-time)の高速検索法を開発した (Takagi et al., IWOCA 2016).(A2)有村は,大規模半構造データ解析エンジンの基盤技術として,楽天研究所の金田との共同研究により,前年に開発したビット並列手法を用いた双方向並列カウンタデータ構造をストリームからの近似頻出値発見問題に適用した.また,JordanとZeugmannは,確率的近似検査法の性能の理論的限界についての成果を学術誌に出版した (Jordan etal. BJMC 2016).(A3) 論理を用いた知識発見アプローチに基づく研究を行い,背景理論を用いた命題論理のソルバーであるSMT (Satisfiable Modulo Theories)を用いた機械学習手法を提案した(CoRR, 2016).さらに,これらの知識に関する論理推論の基盤技術として,限量化子を許した論理ソルバーであるQBFソルバーに関する一連の研究を行った (Jordan et al., JSBMC 2016, AAAI Workshop 2016).(A4) 理論的基盤の研究として,Zeugmannは,超測度学習など測度空間における学習や検索の学術的基盤として,数理解析と計算解析に関する教科書をSpringer社から出版した (Romisch and Zeugmann, 2016).(B1) プロトタイプシステム構築として,各項目で開発したアルゴリズムの理論性能解析と予備実装を行った.

Strategy for Future Research Activity

今後の研究推進方策として,最終年度は,各項目について次のように研究を推進する予定である.(A1) 多系列イベントストリーム索引については,索引で得られる部分系列の出現と計数情報をもとに,組み合わせ属性生成を行い,上位の機械学習アルゴリズムと結合して,イベントストリームを監視して,時系列予測を行うシステムの構築方法を明らかにする.さらに,ビット並列技法および簡潔データ構造技法を用いて,さらなる高速化を行う.(A2)有村は,今年度開発したストリームからの近似頻出値発見技術を,各種の統計スコアに拡張し,大規模半構造データ解析エンジンのための基本技術を探求する.また, イベントの時系列データからの長期的な学習可能性について,その可能性と限界を明らかにする.(A3) 論理を用いた知識発見アプローチの研究をさらに進め,そのための基盤技術として,背景理論を用いたSMTソルバーや,限量化子を用いたQBFソルバーの一層の高速化を進める.並列計算を用いた高速化についても研究を推進する.(A4) 理論的基盤の研究として,高次元空間や測度空間における学習や検索の基礎理論を研究する.(B1) プロトタイプシステム構築として,各項目で開発したアルゴリズムの理論解析と実装を進め,時間的に変化するイベントストリーム上で,ストリーム索引を用いて組み合わせ属性生成を行い,上位の機械学習アルゴリズムと結合して,時系列イベント予測や長期トレンド検出を行うプロトタイプシステムを構築し,実際のイベントストリームデータを用いて,予備的な実証実験を行う.

  • Research Products

    (19 results)

All 2017 2016 Other

All Int'l Joint Research (3 results) Journal Article (8 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 8 results,  Open Access: 5 results) Presentation (2 results) Book (6 results)

  • [Int'l Joint Research] HU Berlin(Germany)

    • Country Name
      Germany
    • Counterpart Institution
      HU Berlin
  • [Int'l Joint Research] Carnegie Mellon University/Google Inc.(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      Carnegie Mellon University/Google Inc.
  • [Int'l Joint Research] Johannes Kepler University(Austria)

    • Country Name
      Austria
    • Counterpart Institution
      Johannes Kepler University
  • [Journal Article] Packed Compact Tries: A Fast and Efficient Data Structure for Online String Processing2017

    • Author(s)
      Takuya Takagi, Shunsuke Inenaga, Kunihiko Sadakane, Hiroki Arimura
    • Journal Title

      Special Issue on Discrete Mathematics and Its Applications, IEICE Trans. Inf. and Syst.

      Volume: 未定 Pages: 未定

    • Peer Reviewed
  • [Journal Article] The Kahr-Moore-Wang Class Contains Untestable Properties2016

    • Author(s)
      Charles Jordan and Thomas Zeugmann
    • Journal Title

      Baltic Journal of Modern Computing

      Volume: Vol. 4, Number 4 Pages: 736-752

    • DOI

      10.22364/bjmc.2016.4.4.11

    • Peer Reviewed / Open Access
  • [Journal Article] Sequence Binary Decision Diagram: Minimization, Relationship to Acyclic Automata, and Complexities of Boolean Set Operations2016

    • Author(s)
      Shuhei Denzumi, Ryo Yoshinaka, Hiroki Arimura, and Shin-ichi Minato
    • Journal Title

      Discrete Applied Mathematics

      Volume: Vol.212 Pages: 61-80

    • DOI

      10.1016/j.dam.2014.11.022

    • Peer Reviewed
  • [Journal Article] QBF Gallery 2014: The QBF Competition at the FLoC 2014 Olympic Games2016

    • Author(s)
      Mikolas Janota, Charles Jordan, Will Klieber, Florian Lonsing, Martina Seidl and Allen Van Gelder
    • Journal Title

      Journal on Satisfiability, Boolean Modeling and Computation

      Volume: 9 Pages: 187-206

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Fully-online construction of suffix trees for multiple texts2016

    • Author(s)
      Takuya Takagi, Shunsuke Inenaga and Hiroki Arimura
    • Journal Title

      Proc. the 27th Annual Symposium on Combinatorial Pattern Matching (CPM'16), Leibniz International Proceedings in Informatics (LIPIcs)

      Volume: Vol.54 Pages: 22:1--22:13

    • DOI

      10.4230/LIPIcs.CPM.2016.22

    • Peer Reviewed / Open Access
  • [Journal Article] Machine Learning with Guarantees using Descriptive Complexity and SMT Solvers2016

    • Author(s)
      Charles Jordan, Lukasz Kaiser
    • Journal Title

      The Computing Research Repository (CoRR)

      Volume: abs/1609.02664 Pages: 1-30

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Packed Compact Tries: A Fast and Efficient Data Structure for Online String Processing2016

    • Author(s)
      Takuya Takagi, Shunsuke Inenaga, Kunihiko Sadakane, Hiroki Arimura
    • Journal Title

      Proc. 27th International Workshop on Combinatorial Algorithm, Lecture Notes in Computer Science, Springer

      Volume: Vol.9843 Pages: 213-225

    • DOI

      10.1007/978-3-319-44543-4_17

    • Peer Reviewed / Open Access
  • [Journal Article] Non-CNF QBF Solving with QCIR2016

    • Author(s)
      Charles Jordan, Will Klieber, Martina Seidl
    • Journal Title

      In Proc. Workshop Beyond NP 2016, The Workshops of the Thirtieth AAAI Conference on Artificial Intelligence, AAAI Technical Report

      Volume: WS-16-05 Pages: 320-326

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] 正規化ハミング距離を用いた三次元点集合マッチングの高速化とインフルエンザウイルス解析への応用2017

    • Author(s)
      佐々木耀一, 渋谷哲朗, 大森亮介, 伊藤公人, 有村博紀
    • Organizer
      情報処理学会第79回全国大会
    • Place of Presentation
      名古屋大学
    • Year and Date
      2017-03-16 – 2017-03-18
  • [Presentation] ラベル情報と構造情報の相関を用いた三次元点集合マッチングの高速化とそのインフルエンザウイルス解析への応用2017

    • Author(s)
      佐々木 耀一,渋谷 哲朗,大森 亮介,伊藤 公人, 有村 博紀
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM2017)
    • Place of Presentation
      高山グリーンホテル
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Book] PAC Learning. Encyclopedia of Machine Learning and Data Mining2017

    • Author(s)
      Thomas Zeugmann
    • Total Pages
      1335(949-959)
    • Publisher
      Springer
  • [Book] Stochastic Finite Learning. Encyclopedia of Machine Learning and Data Mining2017

    • Author(s)
      Thomas Zeugmann
    • Total Pages
      1335(1187-1191)
    • Publisher
      Springer
  • [Book] VC Dimension. Encyclopedia of Machine Learning and Data Mining2017

    • Author(s)
      Thomas Zeugmann
    • Total Pages
      1335(1323-1327)
    • Publisher
      Springer
  • [Book] Mathematical Analysis and the Mathematics of Computation2016

    • Author(s)
      Werner Romisch, Thomas Zeugmann
    • Total Pages
      703
    • Publisher
      Springer
  • [Book] Special Issue on the 25th International Conference on Algorithmic Learning Theory (ALT 2014), Guest editors' foreword, Theor. Comput. Sci. 6502016

    • Author(s)
      Peter Auer, Alexander Clark, Thomas Zeugmann
    • Total Pages
      158(1-3)
    • Publisher
      Elsevier
  • [Book] Special Issue on the 24th International Conference on Algorithmic Learning Theory (ALT 2013), Guest Editors' foreword, Theor. Comput. Sci. Vol.6202016

    • Author(s)
      Sanjay Jain, Remi Munos, Frank Stephan, Thomas Zeugmann
    • Total Pages
      134(1-3)
    • Publisher
      Elsevier

URL: 

Published: 2018-01-16   Modified: 2022-02-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi