• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

大規模実世界時空間データストリーム処理のための超高速な検索・発見技術の研究

研究課題

研究課題/領域番号 15K12022
研究機関北海道大学

研究代表者

有村 博紀  北海道大学, 情報科学研究科, 教授 (20222763)

研究分担者 トーマス ツォイクマン  北海道大学, 情報科学研究科, 教授 (60374609)
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード情報検索 / データマイニング / ストリームデータ処理 / 大規模知識処理 / QBFソルバー / 多重性 / 文脈性
研究実績の概要

本研究では,多様で膨大な実世界時空間ストリームデータに対する高速大規模処理の基盤技術として,複雑なパターンに対する検索・計数・発見技術を中心に研究開発する.とくに,アルゴリズムの高速性と低メモリ性に加えて,実世界時空間ストリーム処理の特性に対応して,適応性・文脈性・多重性をもつアルゴリズムの開発に焦点を当てて研究した.最終年度のプロトタイプシステム構築を目指して,各テーマごとに,アルゴリズム開発と,理論解析,実装評価を並行して進めた.具体的には,研究期間全体では,次の5つの分担研究項目の研究を行った.(A1) ビット並列技法を用いた超高速実世界ストリーム検索技術の研究開発(有村)(A2) 確率的近似検査法に基づく超高速実世界ストリーム計数技術の研究開発(ジョーダン,有村)(A3) 構造列挙手法に基づく超高速実世界ストリーム発見技術の研究開発(有村・ジョーダン)(A4) 超高速ストリーム知識発見の理論的基盤の研究(ツォイグマン,有村)(B1) プロトタイプシステム構築と予備評価実験.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度は,各項目について次のように研究を推進した.(A1) K本の成長し続けるイベントストリームに対して,その部分系列の出現と計数を管理する系列索引の線形時間構築アルゴリズムを開発した(Takagi et al., CPM 2016).さらに,接尾辞木自体の検索を高速化するために,ビット並列技法を用いた亜線形時間(sublinear-time)の高速検索法を開発した (Takagi et al., IWOCA 2016).(A2)有村は,大規模半構造データ解析エンジンの基盤技術として,楽天研究所の金田との共同研究により,前年に開発したビット並列手法を用いた双方向並列カウンタデータ構造をストリームからの近似頻出値発見問題に適用した.また,JordanとZeugmannは,確率的近似検査法の性能の理論的限界についての成果を学術誌に出版した (Jordan etal. BJMC 2016).(A3) 論理を用いた知識発見アプローチに基づく研究を行い,背景理論を用いた命題論理のソルバーであるSMT (Satisfiable Modulo Theories)を用いた機械学習手法を提案した(CoRR, 2016).さらに,これらの知識に関する論理推論の基盤技術として,限量化子を許した論理ソルバーであるQBFソルバーに関する一連の研究を行った (Jordan et al., JSBMC 2016, AAAI Workshop 2016).(A4) 理論的基盤の研究として,Zeugmannは,超測度学習など測度空間における学習や検索の学術的基盤として,数理解析と計算解析に関する教科書をSpringer社から出版した (Romisch and Zeugmann, 2016).(B1) プロトタイプシステム構築として,各項目で開発したアルゴリズムの理論性能解析と予備実装を行った.

今後の研究の推進方策

今後の研究推進方策として,最終年度は,各項目について次のように研究を推進する予定である.(A1) 多系列イベントストリーム索引については,索引で得られる部分系列の出現と計数情報をもとに,組み合わせ属性生成を行い,上位の機械学習アルゴリズムと結合して,イベントストリームを監視して,時系列予測を行うシステムの構築方法を明らかにする.さらに,ビット並列技法および簡潔データ構造技法を用いて,さらなる高速化を行う.(A2)有村は,今年度開発したストリームからの近似頻出値発見技術を,各種の統計スコアに拡張し,大規模半構造データ解析エンジンのための基本技術を探求する.また, イベントの時系列データからの長期的な学習可能性について,その可能性と限界を明らかにする.(A3) 論理を用いた知識発見アプローチの研究をさらに進め,そのための基盤技術として,背景理論を用いたSMTソルバーや,限量化子を用いたQBFソルバーの一層の高速化を進める.並列計算を用いた高速化についても研究を推進する.(A4) 理論的基盤の研究として,高次元空間や測度空間における学習や検索の基礎理論を研究する.(B1) プロトタイプシステム構築として,各項目で開発したアルゴリズムの理論解析と実装を進め,時間的に変化するイベントストリーム上で,ストリーム索引を用いて組み合わせ属性生成を行い,上位の機械学習アルゴリズムと結合して,時系列イベント予測や長期トレンド検出を行うプロトタイプシステムを構築し,実際のイベントストリームデータを用いて,予備的な実証実験を行う.

  • 研究成果

    (19件)

すべて 2017 2016 その他

すべて 国際共同研究 (3件) 雑誌論文 (8件) (うち国際共著 3件、 査読あり 8件、 オープンアクセス 5件) 学会発表 (2件) 図書 (6件)

  • [国際共同研究] HU Berlin(Germany)

    • 国名
      ドイツ
    • 外国機関名
      HU Berlin
  • [国際共同研究] Carnegie Mellon University/Google Inc.(米国)

    • 国名
      米国
    • 外国機関名
      Carnegie Mellon University/Google Inc.
  • [国際共同研究] Johannes Kepler University(Austria)

    • 国名
      オーストリア
    • 外国機関名
      Johannes Kepler University
  • [雑誌論文] Packed Compact Tries: A Fast and Efficient Data Structure for Online String Processing2017

    • 著者名/発表者名
      Takuya Takagi, Shunsuke Inenaga, Kunihiko Sadakane, Hiroki Arimura
    • 雑誌名

      Special Issue on Discrete Mathematics and Its Applications, IEICE Trans. Inf. and Syst.

      巻: 未定 ページ: 未定

    • 査読あり
  • [雑誌論文] The Kahr-Moore-Wang Class Contains Untestable Properties2016

    • 著者名/発表者名
      Charles Jordan and Thomas Zeugmann
    • 雑誌名

      Baltic Journal of Modern Computing

      巻: Vol. 4, Number 4 ページ: 736-752

    • DOI

      10.22364/bjmc.2016.4.4.11

    • 査読あり / オープンアクセス
  • [雑誌論文] Sequence Binary Decision Diagram: Minimization, Relationship to Acyclic Automata, and Complexities of Boolean Set Operations2016

    • 著者名/発表者名
      Shuhei Denzumi, Ryo Yoshinaka, Hiroki Arimura, and Shin-ichi Minato
    • 雑誌名

      Discrete Applied Mathematics

      巻: Vol.212 ページ: 61-80

    • DOI

      10.1016/j.dam.2014.11.022

    • 査読あり
  • [雑誌論文] QBF Gallery 2014: The QBF Competition at the FLoC 2014 Olympic Games2016

    • 著者名/発表者名
      Mikolas Janota, Charles Jordan, Will Klieber, Florian Lonsing, Martina Seidl and Allen Van Gelder
    • 雑誌名

      Journal on Satisfiability, Boolean Modeling and Computation

      巻: 9 ページ: 187-206

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Fully-online construction of suffix trees for multiple texts2016

    • 著者名/発表者名
      Takuya Takagi, Shunsuke Inenaga and Hiroki Arimura
    • 雑誌名

      Proc. the 27th Annual Symposium on Combinatorial Pattern Matching (CPM'16), Leibniz International Proceedings in Informatics (LIPIcs)

      巻: Vol.54 ページ: 22:1--22:13

    • DOI

      10.4230/LIPIcs.CPM.2016.22

    • 査読あり / オープンアクセス
  • [雑誌論文] Machine Learning with Guarantees using Descriptive Complexity and SMT Solvers2016

    • 著者名/発表者名
      Charles Jordan, Lukasz Kaiser
    • 雑誌名

      The Computing Research Repository (CoRR)

      巻: abs/1609.02664 ページ: 1-30

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Packed Compact Tries: A Fast and Efficient Data Structure for Online String Processing2016

    • 著者名/発表者名
      Takuya Takagi, Shunsuke Inenaga, Kunihiko Sadakane, Hiroki Arimura
    • 雑誌名

      Proc. 27th International Workshop on Combinatorial Algorithm, Lecture Notes in Computer Science, Springer

      巻: Vol.9843 ページ: 213-225

    • DOI

      10.1007/978-3-319-44543-4_17

    • 査読あり / オープンアクセス
  • [雑誌論文] Non-CNF QBF Solving with QCIR2016

    • 著者名/発表者名
      Charles Jordan, Will Klieber, Martina Seidl
    • 雑誌名

      In Proc. Workshop Beyond NP 2016, The Workshops of the Thirtieth AAAI Conference on Artificial Intelligence, AAAI Technical Report

      巻: WS-16-05 ページ: 320-326

    • 査読あり / 国際共著
  • [学会発表] 正規化ハミング距離を用いた三次元点集合マッチングの高速化とインフルエンザウイルス解析への応用2017

    • 著者名/発表者名
      佐々木耀一, 渋谷哲朗, 大森亮介, 伊藤公人, 有村博紀
    • 学会等名
      情報処理学会第79回全国大会
    • 発表場所
      名古屋大学
    • 年月日
      2017-03-16 – 2017-03-18
  • [学会発表] ラベル情報と構造情報の相関を用いた三次元点集合マッチングの高速化とそのインフルエンザウイルス解析への応用2017

    • 著者名/発表者名
      佐々木 耀一,渋谷 哲朗,大森 亮介,伊藤 公人, 有村 博紀
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM2017)
    • 発表場所
      高山グリーンホテル
    • 年月日
      2017-03-06 – 2017-03-08
  • [図書] PAC Learning. Encyclopedia of Machine Learning and Data Mining2017

    • 著者名/発表者名
      Thomas Zeugmann
    • 総ページ数
      1335(949-959)
    • 出版者
      Springer
  • [図書] Stochastic Finite Learning. Encyclopedia of Machine Learning and Data Mining2017

    • 著者名/発表者名
      Thomas Zeugmann
    • 総ページ数
      1335(1187-1191)
    • 出版者
      Springer
  • [図書] VC Dimension. Encyclopedia of Machine Learning and Data Mining2017

    • 著者名/発表者名
      Thomas Zeugmann
    • 総ページ数
      1335(1323-1327)
    • 出版者
      Springer
  • [図書] Mathematical Analysis and the Mathematics of Computation2016

    • 著者名/発表者名
      Werner Romisch, Thomas Zeugmann
    • 総ページ数
      703
    • 出版者
      Springer
  • [図書] Special Issue on the 25th International Conference on Algorithmic Learning Theory (ALT 2014), Guest editors' foreword, Theor. Comput. Sci. 6502016

    • 著者名/発表者名
      Peter Auer, Alexander Clark, Thomas Zeugmann
    • 総ページ数
      158(1-3)
    • 出版者
      Elsevier
  • [図書] Special Issue on the 24th International Conference on Algorithmic Learning Theory (ALT 2013), Guest Editors' foreword, Theor. Comput. Sci. Vol.6202016

    • 著者名/発表者名
      Sanjay Jain, Remi Munos, Frank Stephan, Thomas Zeugmann
    • 総ページ数
      134(1-3)
    • 出版者
      Elsevier

URL: 

公開日: 2018-01-16   更新日: 2022-02-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi