平成30年度では,ストリーム環境における集合データの動的Join問題に関して,データベース分野における世界最高峰の国際会議の一つ(IEEE International Conference on Data Engineering)にフルペーパー採択された(2019年4月に発表).これは,平成29年度で取り組んだ問題の成果を論文化したものである.本論文は,各集合データに最も類似しているk個の集合データをそれぞれ正確かつリアルタイムにモニタリングする技術を提案したものである. また,ストリーミング時系列データにおける外れ値検出問題に取り組んだ.Wifi環境の普及から,多くのセンサを取り入れたIoTデバイスも普及し,多くのアプリケーションでストリーミング時系列データが生成されている.ストリーミング時系列データにおける外れ値の検出・モニタリングは,異常検知やデータクリーニングに欠かせない技術である.平成30年度では,この問題に対する高速アルゴリズムを設計し,様々なドメインの実データを用いて有効性を確認した.本内容は第11回データ工学と情報マネジメントに関するフォーラムで発表している.また,正確なモニタリングではなく近似的なモニタリングを行うことによりさらなる高速化を取り入れたアルゴリズムを設計した.このアルゴリズムは近似性について理論的な保証を持つ.本内容は,国際会議に投稿中である.
|