2013 年度実績報告書

100億ノードからなる自律分散システムのシミュレーション手法

研究課題

研究課題/領域番号	25700008
研究種目	若手研究(A)
研究機関	東京工業大学
研究代表者	首藤一幸東京工業大学, 情報理工学(系)研究科, 准教授 (90308271)
研究期間 (年度)	2013-04-01 – 2017-03-31
キーワード	シミュレーション / 大規模分散システム
研究概要	我々はこれまで、計算機1台上で動作するシミュレータを並列化・分散化することで複数台で動作するようにし、シミュレート可能規模を大きくすることを試みてきた。このアプローチは一定の成功を収め、数台で数倍規模のシミュレーションを達成した。しかし一方で、致命的な問題がいくつか明らかになった。シミュレーション速度は通信オーバヘッドによって大幅に、1桁～数桁、低下した。そして何よりも、今後の大規模化ではシミュレータが耐故障性を備えることが必須となっていくにもかかわらず、機能の開発・メンテナンスには極めて大きな時間と労力がかかることが判ってきた。そこで我々は、既存の大規模データ処理システム、具体的にはMapReduce処理系や分散グラフ処理系を用いた分散システムシミュレーションの検討を始めた。つまり、シミュレーション対象をデータ処理の方式・システムで扱うのである。例えばMapReduce処理系Apache Hadoopには4,000台での動作実績があり、この規模でシミュレーションを行うことができれば、100万×4,000 = 40億ノード程度のシミュレーションが可能かもしれない。一方で、このアプローチには別の課題がある。こうしたデータ処理システムは、データ処理と計算機間通信を交互に繰り返すBulk Synchronous Parallel (BSP) モデルで動作する。これを素直に分散システムシミュレーションに適用すると、ノード間通信は一斉にしか行えないこととなり、これでは通信タイミングについて近似的なシミュレーションしか行えない。 Bulk Synchronous Parallel (BSP) モデルで分散処理を進めつつも、シミュレーション対象のノード群が通信を行う時刻、順序、依存関係を正しくシミュレートできる手法を開発した。それをMapReduce処理系の上に実装し、ある種の分散アルゴリズムをシミュレートできることを確認した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由計画していた通り、時間の取り扱い手法を開発し、その有効性をある程度確認できた。
今後の研究の推進方策	計画通り、手法の有効性確認を進める。具体的には、より大規模なシミュレーション、いくつかのネットワークトポロジでのシミュレーション、シミュレータのリソース消費量（保存しておくログの長さ）の調査などを進める。
次年度の研究費の使用計画	平成25年度の充足率60%を踏まえて、実験用機材の購入計画を変更したため。平成26年度以降、実験用機材を購入するか、または、購入せずに済む方法を検討する（例えば、機材が必要な実験は他の研究として行う、など）。

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] MapReduceによる大規模分散システムのシミュレーション2013
- 著者名/発表者名
  杉野好宏, 華井雅俊, 首藤一幸
- 学会等名
  電子情報通信学会技術研究報告, Vol.113, No.244, NS2013-109, pp.99-104
- 発表場所
  北海道大学
- 年月日
  20131017-20131018