2016 Fiscal Year Research-status Report
大規模実世界時空間データストリーム処理のための超高速な検索・発見技術の研究
Project/Area Number |
15K12022
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
トーマス ツォイクマン 北海道大学, 情報科学研究科, 教授 (60374609)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 情報検索 / データマイニング / ストリームデータ処理 / 大規模知識処理 / QBFソルバー / 多重性 / 文脈性 |
Outline of Annual Research Achievements |
本研究では,多様で膨大な実世界時空間ストリームデータに対する高速大規模処理の基盤技術として,複雑なパターンに対する検索・計数・発見技術を中心に研究開発する.とくに,アルゴリズムの高速性と低メモリ性に加えて,実世界時空間ストリーム処理の特性に対応して,適応性・文脈性・多重性をもつアルゴリズムの開発に焦点を当てて研究した.最終年度のプロトタイプシステム構築を目指して,各テーマごとに,アルゴリズム開発と,理論解析,実装評価を並行して進めた.具体的には,研究期間全体では,次の5つの分担研究項目の研究を行った.(A1) ビット並列技法を用いた超高速実世界ストリーム検索技術の研究開発(有村)(A2) 確率的近似検査法に基づく超高速実世界ストリーム計数技術の研究開発(ジョーダン,有村)(A3) 構造列挙手法に基づく超高速実世界ストリーム発見技術の研究開発(有村・ジョーダン)(A4) 超高速ストリーム知識発見の理論的基盤の研究(ツォイグマン,有村)(B1) プロトタイプシステム構築と予備評価実験.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,各項目について次のように研究を推進した.(A1) K本の成長し続けるイベントストリームに対して,その部分系列の出現と計数を管理する系列索引の線形時間構築アルゴリズムを開発した(Takagi et al., CPM 2016).さらに,接尾辞木自体の検索を高速化するために,ビット並列技法を用いた亜線形時間(sublinear-time)の高速検索法を開発した (Takagi et al., IWOCA 2016).(A2)有村は,大規模半構造データ解析エンジンの基盤技術として,楽天研究所の金田との共同研究により,前年に開発したビット並列手法を用いた双方向並列カウンタデータ構造をストリームからの近似頻出値発見問題に適用した.また,JordanとZeugmannは,確率的近似検査法の性能の理論的限界についての成果を学術誌に出版した (Jordan etal. BJMC 2016).(A3) 論理を用いた知識発見アプローチに基づく研究を行い,背景理論を用いた命題論理のソルバーであるSMT (Satisfiable Modulo Theories)を用いた機械学習手法を提案した(CoRR, 2016).さらに,これらの知識に関する論理推論の基盤技術として,限量化子を許した論理ソルバーであるQBFソルバーに関する一連の研究を行った (Jordan et al., JSBMC 2016, AAAI Workshop 2016).(A4) 理論的基盤の研究として,Zeugmannは,超測度学習など測度空間における学習や検索の学術的基盤として,数理解析と計算解析に関する教科書をSpringer社から出版した (Romisch and Zeugmann, 2016).(B1) プロトタイプシステム構築として,各項目で開発したアルゴリズムの理論性能解析と予備実装を行った.
|
Strategy for Future Research Activity |
今後の研究推進方策として,最終年度は,各項目について次のように研究を推進する予定である.(A1) 多系列イベントストリーム索引については,索引で得られる部分系列の出現と計数情報をもとに,組み合わせ属性生成を行い,上位の機械学習アルゴリズムと結合して,イベントストリームを監視して,時系列予測を行うシステムの構築方法を明らかにする.さらに,ビット並列技法および簡潔データ構造技法を用いて,さらなる高速化を行う.(A2)有村は,今年度開発したストリームからの近似頻出値発見技術を,各種の統計スコアに拡張し,大規模半構造データ解析エンジンのための基本技術を探求する.また, イベントの時系列データからの長期的な学習可能性について,その可能性と限界を明らかにする.(A3) 論理を用いた知識発見アプローチの研究をさらに進め,そのための基盤技術として,背景理論を用いたSMTソルバーや,限量化子を用いたQBFソルバーの一層の高速化を進める.並列計算を用いた高速化についても研究を推進する.(A4) 理論的基盤の研究として,高次元空間や測度空間における学習や検索の基礎理論を研究する.(B1) プロトタイプシステム構築として,各項目で開発したアルゴリズムの理論解析と実装を進め,時間的に変化するイベントストリーム上で,ストリーム索引を用いて組み合わせ属性生成を行い,上位の機械学習アルゴリズムと結合して,時系列イベント予測や長期トレンド検出を行うプロトタイプシステムを構築し,実際のイベントストリームデータを用いて,予備的な実証実験を行う.
|
Research Products
(19 results)
-
-
-
-
-
-
-
-
-
-
-
[Journal Article] Non-CNF QBF Solving with QCIR2016
Author(s)
Charles Jordan, Will Klieber, Martina Seidl
-
Journal Title
In Proc. Workshop Beyond NP 2016, The Workshops of the Thirtieth AAAI Conference on Artificial Intelligence, AAAI Technical Report
Volume: WS-16-05
Pages: 320-326
Peer Reviewed / Int'l Joint Research
-
-
-
-
-
-
-
-