近年の高速インターネット環境の急速な整備、および、電子商取引やネットオークションにみられるような社会インフラとしてのインターネットの重要性の増加に伴い、高速なネットワークに流れる大量のデータから高速に実時間で価値のあるデータを見つけ出す技術に対するニーズが高まっていた。しかしながら現在のインターネットは10Gbps以上の高速回線により毎秒100万パケット以上、1日あたりに換算すると数十〜数百テラバイト単位のデータが流れており、このような高速・大容量のデータから実時間で価値のあるデータを見つけ出す技術は確立されていなかった。 本研究では、上記のような高速・大容量のデータに適用可能なストリームマイニング技術を研究し、主として以下の成果を得た。 1. 単に大量のデータをオンライン処理可能な技術だけでなく、刻々と変化するデータの重要度(コンセプトドリフト)に自動的に追従する機能を開発した。この結果をネットワーク計測などに応用し、論文発表を行った。 2. さらにデータ重要度の変化に自動追従する事により、TV視聴率の実時間解析を中心とした広告効果解析と購買データ分析のためのデータマイニング技術への応用を検討し、論文発表を行った。
|