Googleの代表的なソフトウェアサービスフレームワークであるMapReduceでは,ジョブレベルの応答性能を劣化させる落伍者の問題に対処するため,個々のタスクの処理状況をステップ単位で管理し,ある閾値以上の処理時間が経過しても終了しないタスクの残りステップを別のワーカマシンにも並列的に処理させることで,全体のジョブ応答時間の短縮化を図るバックアップタスクと呼ばれる性能改善手法を導入している.本年度は単一の並列タスク処理に対するバックアップタスクの性能改善効果について,極値理論に基づくジョブ応答時間の近似解析を行った.具体的には,各ワーカマシンにおけるタスク処理時間に対して閾値を設け,タスク処理を行っているワーカマシン群の内,タスク処理にかかる時間が閾値を超えたワーカマシンに対してそのタスク全体の複製を代替ワーカマシンで実行させる確率モデルを考え,このモデルに対して極値理論に基づくジョブ応答時間と総タスク処理時間の近似解析を行った.数値例より,ワーカーでの処理時間が裾の重い分布に従うときは小さい閾値の方が電力消費量削減の観点から効果的であること,裾が軽い分布のときは逆に大きい閾値設定の方が電力消費量を大幅に削減できること,などが判明した.
|