2015 Fiscal Year Research-status Report
大規模実世界時空間データストリーム処理のための超高速な検索・発見技術の研究
Project/Area Number |
15K12022
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
トーマス ツォイクマン 北海道大学, 情報科学研究科, 教授 (60374609)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 情報検索 / データマイニング / ストリームデータ処理 / 文脈性 / 多重性 |
Outline of Annual Research Achievements |
本研究では,多様で膨大な実世界時空間ストリームデータに対する高速大規模処理の基盤技術として,複雑なパターンに対する検索・計数・発見技術を中心に研究開発する.とくに,アルゴリズムの高速性と低メモリ性に加えて,実世界時空間ストリーム処理の特性に対応して,適応性・文脈性・多重性をもつアルゴリズムの開発に焦点を当てて研究した.最終年度のプロトタイプシステム構築を目指して,各テーマごとに,アルゴリズム開発と,理論解析,実装評価を並行して進めた. 具体的には,研究期間全体では,次の5つの分担研究項目の研究を行った.(A1)ビット並列技法を用いた超高速実世界ストリーム検索技術の研究開発(有村)(A2)確率的近似検査法に基づく超高速実世界ストリーム計数技術の研究開発(ジョーダン,有村)(A3)構造列挙手法に基づく超高速実世界ストリーム発見技術の研究開発(有村・ジョーダン)(A4)超高速ストリーム知識発見の理論的基盤の研究(ツォイグマン,有村)(B1)プロトタイプシステム構築と予備評価実験.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,各項目について次のように研究を推進した.(A1) ビット並列技法を用いた超高速実世界ストリーム検索技術の研究開発(有村).2次元空間における移動体の軌跡データを対象として,指定された近似的な時空間パターンの出現を検出する高速なオンラインパターン照合アルゴリズムを開発した.そのために必要な数値データを離散的値に変換するための高速な位置同定データ構造の論理演算と数値演算を用いた実用的実装方法を開発した.(A2) 確率的近似検査法に基づく超高速実世界ストリーム計数技術の研究開発(ジョーダン,有村).有村は,楽天研究所の金田悠作氏と協力して,超高速ストリーム計数のための双方向カウンタデータ構造を開発した.これは,ビット幅wの計算機上でM個のKビットカウンタをO(KM/w)メモリで格納し,ビット幅によらずO(M/w)時間で値の加算と減算およびゼロ判定を行えるものであり,JSONなどの半構造ストリームの高速検索の鍵となる.(A3) 構造列挙手法に基づく超高速実世界ストリーム発見技術の研究開発(有村・ジョーダン).ジョーダンは,構造列挙の基本技術として,量化子つき命題論理式のためのグラフ表現を提案した.これは,木構造の式を部分式の共有をゆるしてコンパクトに圧縮し,そのまま推論可能な技術である.(A4) 超高速ストリーム知識発見の理論的基盤の研究(ツォイグマン,有村).ツォイグマンは,次年度以降の研究のために超測度(ultrametric)に関する調査を行った.また有村は,研究協力者の高木拓也と協力して,多重ストリームに対するオンライン索引構築問題に対して従来からある接尾辞木と語グラフを融合することで,世界で初めて線形時間の非同期オンライン構築が可能であることを示した.(B1) プロトタイプシステム構築と予備評価実験.初年度は,この項目は研究を実施しない.
|
Strategy for Future Research Activity |
今後の研究推進方策は次の通りである:(A1)ビット並列技法を用いた超高速実世界ストリーム検索技術の研究開発(有村).今年度開発した軌跡データに対する検索アルゴリズムにパターン出現の統計的有意性を考慮した称号スコアを組み込む.また,開発したワードRAM上の高速な位置同定データ構造を分岐演算を用いない実装方法を開発し,GPUやハードウェア上での高速な実装方を明らかにする.(A2)確率的近似検査法に基づく超高速実世界ストリーム計数技術の研究開発(ジョーダン,有村).有村は,双方向カウンタデータ構造を用いたストリーム計数と半構造データ解析エンジンを開発する.また,これに基づきJSONなどの半構造ストリームの高速検索へ拡張する.(A3) 構造列挙手法に基づく超高速実世界ストリーム発見技術の研究開発(有村・ジョーダン).先に開発した論理式のためのグラフ表現に基づいて,知識を表すパターンの列挙アルゴリズムを開発する.また,グラフのパス上の値の伝搬に関する制約をもつ部分グラフクラスに関するならし定数時間の高速アルゴリズムを研究する.(A4) 超高速ストリーム知識発見の理論的基盤の研究(ツォイグマン,有村).超測度学習に関して学習モデルおよび効率よく同定可能な概念族を研究する.また,多重ストリームに対するオンライン索引技術を発展させて,索引上でのストリームパターンマイニングの効率良い構築方法を明らかにする.とくに非同期ストリームにおいて限定された資源を用いながら,統計的有意性に関する意味スコアをオンラインで計算し,興味深いパターンを管理しながら,構造変化を検出できるような技術を開発する.(B1) プロトタイプシステム構築と予備評価実験.各項目について,開発したアルゴリズムをもとにストリーム処理エンジンを実装し,予備実験と理論解析を行いつつ,最適化する.
|
Causes of Carryover |
平成28年3月の使用分が会計システムに反映されていないため.
|
Expenditure Plan for Carryover Budget |
すでに使用済み.
|
Research Products
(15 results)