2016 Fiscal Year Research-status Report
ストリーム環境におけるデータモニタリングに関する研究
Project/Area Number |
16K16056
|
Research Institution | Osaka University |
Principal Investigator |
天方 大地 大阪大学, 情報科学研究科, 助教 (40770649)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | ストリームデータ / データモニタリング |
Outline of Annual Research Achievements |
本年度では、申請書に記載した計画通り、複数ストリーム間における共起データをモニタリングする問題に取り組み、リアルタイムに共起パターンをモニタリングできる技術を開発した。この問題は実世界の幅広いアプリケーションに適用でき、社会的・産業的に効果があり、かつ重要なものである。例えば、Twitterの多くのアカウントで同じような単語を含むツイートが現れている場合、その単語は実世界で起きているイベントを表しており、本問題を解くことにより高速にイベントを検知できる。同様に、ウェブの利用パターン、eコマース、相関ルールマイニングなども応用例として挙げられる. 実応用の観点から、リアルタイム性は自明の要件である。本問題はこれまで誰も取組んだことのないものであり、既存の研究で提案されている技術を応用した場合、リアルタイム性を失うことも実験から明らかにした。本研究では、これまでになかった新しいデータ構造を考案し、データの発生頻度が非常に大きい場合においても高速に解を更新するアルゴリズムをデザインした。実世界のデータを用いた実験から提案アルゴリズムはメモリ使用量の小さく、実行時間も短いことを明らかにした。 さらに本年度では、上記の問題の関連問題である、データ集合から、互いに相関している部分データの集合を抽出する問題にも取り組んだ。この問題は、近年多くのアプリケーションによって生成されている時系列データ(ストリームデータのログ)を対象としている。この問題のNP困難性を証明し、ハッシュ関数によって高速に近似解を計算するアルゴリズムを考案した。提案アルゴリズムの有用性を実データを用いた実験から明らかにし、実践的であることを示した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画では、本年度では複数ストリーム間の共起パターンをモニタリングする問題にのみ取り組む予定であった。この問題については、既存研究の応用の性能限界、新しいアルゴリズム・データ構造のデザイン、提案アルゴリズムの性能評価を全て実施し、国内研究会での発表およびデータベース分野で著名や論文誌に投稿するに至った。 また、本研究を進めていくうちに、関連する重要な問題の着想に至った。この問題に対しても効率的な解法を提案し、提案アルゴリズムの性能評価を行い、データマイニング分野で著名な国際会議に投稿するに至った。そのため、今年度は当初の計画以上の成果を達成できたものと考える。
|
Strategy for Future Research Activity |
当初の計画では、次年度ではストリームデータに対する集合被覆問題に取り組む予定である。この問題に具体的に取り組む前に、この問題の関連研究についてサーベイを行い、現時点でどのような類似研究が存在しているかを把握する。その後、具体的な問題定義を行い、その問題に対する効率的な解法を考案していく予定である。 また、時系列データに関する研究も同時に進めていく予定である。本年度で扱ったデータは、ストリームデータのログであり、更新がない、または更新頻度が小さい環境を想定していた。次年度では、時系列ストリームデータを対象とし、互いに相関しているデータの集合をモニタリングする問題に取り組む。データの更新頻度が大きい場合、静的なデータを対象としていたアルゴリズムではリアルタイム性を確保することが難しい。そのため、解を逐次的に更新できるアルゴリズムを考える必要がある。
|
Research Products
(4 results)