研究課題/領域番号 |
24500106
|
研究種目 |
基盤研究(C)
|
研究機関 | 筑波大学 |
研究代表者 |
川島 英之 筑波大学, システム情報系, 講師 (90407148)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | データベース / ストリーム処理 / 暗号化処理 / 異常検知 / リアルタイム処理 |
研究概要 |
本研究の目的はリアルタイム事象検知基盤システムの構築である。24年度は特に暗号化ストリーム処理に関する研究、連続系における異常検知に関する研究、ストリームデータとリレーショナルデータの結合に関する研究、FPGAによる高性能化についての研究を進めた。以下に暗号化と結合に関する研究概要を述べる。 大量のストリーム情報源に対して処理を行うためには、ストリーム処理システムには非常に高い演算処理能力が要求される。このような処理の実行にはパブリッククラウドなどの分散並列処理基盤を用いることが有効であると考えられる。しかし、パブリッククラウドは一般に組織のファイアウォールの外側で第三者により管理されるため、情報の機密性を保持することができない。これに対し我々は、安全性を考慮したストリームデータ処理の実現を目的として、暗号化ストリームデータ処理に関する研究を行った。 データストリームの分析処理では、データストリームの他にリレーショナルデータやクラス分類器のモデルデータなど様々な外部リソースを参照し、その結果を集計することが多い。しかし、こうした処理の最中に外部リソースが更新された場合、一つの集計結果を計算する過程で参照した外部リソースが一貫したものではなくなるおそれがあった。本研究では、この問題を防ぐことのできる処理パラダイムとして、トランザクショナルデータストリーム処理を提案した。トランザクショナルデータストリーム処理は、継続的クエリにおいて連続的に実行されるリソースの参照処理群を継続的クエリ由来トランザクションと呼ばれるトランザクションへと割り当てる。そして、これらのトランザクションとリソースを更新するトランザクションの間で適切に同時実行制御をおこなうことにより、一貫性の問題を解決した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度はストリーム処理システムのカーネル部分を構築し、また、暗号化ストリーム処理機能、ストリームとリレーションとの統合機能、そして連続系からの異常検出機能(Change Point Detection(CPD))に関する研究を行った。これらはリアルタイムイベント検知について重要な機能である。特にCPDに関してはmalware workshop(MWS)においてIIJが有する100台のハニーポットから収集されたデータを対象に実験を行い、CPDの有用性を確認することができた。また、CPDがNICTERなるマルウェア検知システムにおいて使われているとの情報を得た。以上より、研究は順調に進捗していると考えられる。今後、これらの機能のカーネル部分への組込みを行う予定である。
|
今後の研究の推進方策 |
3年計画の2年目となる25年度は、異常検出機能を増やし、また、それらをカーネルに組み込んでいく予定である。現在予定している異常検出機能は、distance based outlier, local outlier factor、そして frequent itemset mining の3つである。しかし時間の許す限り新しい異常検出機能を導入すると共に、その高性能化を達成していきたいと考える。また、異常検知の理由を説明するために来歴管理機能の研究開発を行う所存である。さらにFPGAを用いた高性能化を一段と進める予定である。現在はjoinだけであるが、これにwindow-aggregateを追加し、さらに各種の異常検出手法のFPGAに挑戦する。
|
次年度の研究費の使用計画 |
25年度の研究費は、初年度に得た成果の発表費用、上記の異常検出に関して学生諸君に手伝ってもらう際の謝金、そして開発用マシンの購入などに利用したいと考えている。
|