2012 年度実績報告書

ウェブ上の大規模ストリーミングデータを用いた実世界リアルタイム分析基盤

研究課題

研究課題/領域番号	22650017
研究機関	東京工業大学
研究代表者	鈴村豊太郎東京工業大学, 情報理工学(系)研究科, 准教授 (70552438)
研究期間 (年度)	2010-04-01 – 2013-03-31
キーワード	ストリーム / リアルタイム / ビッグデータ
研究概要	データストリーム処理においては，Twitterストリームに対するリアルタイム自然言語処理システムのように，大容量のストリームデータを低レイテンシで処理することが求められるようなアプリケーションがある．しかし，例えばTwitterにおいてツイートの量が一時的に増大するような時，入力データレートがシステムの処理能力を超えてしまい処理レイテンシが増加すると，アプリケーションのサービスレベル・アグリーメントを満たせない場合がある．そのような過負荷時に入力データの一部を削除するLoad Sheddingという手法があるが，レイテンシを確保する代わりに計算精度は落ちてしまい，後に別のアプリケーションで同じ計算結果を利用したい時に問題となってしまう．我々はLoad Sheddingによって削除されるデータと不完全な計算結果の両方をストレージに保持し，システムの処理能力に余裕があるときに前者のデータを再度読み込んで処理を施し，後者の値と集約することによって計算結果を補完する処理機構を提案した
現在までの達成度 (区分)	理由 24年度が最終年度であるため、記入しない。
今後の研究の推進方策	24年度が最終年度であるため、記入しない。

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] Load Sheddingによる近似計算を補完するデータストリーム処理システム2013
- 著者名/発表者名
  岡田瑞穂
- 学会等名
  日本データベース学会年次大会　deim 2013　第5回データ工学と情報マネジメントに関するフォーラム
- 発表場所
  ホテル華の湯(福島県)
- 年月日
  20130303-20130305