研究課題/領域番号 |
25540007
|
研究種目 |
挑戦的萌芽研究
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
笠原 正治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (20263139)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
キーワード | 情報基礎 / クラウド・コンピューティング / 極値理論 / タスク・スケジューリング / 性能解析 |
研究概要 |
研究の第一段階として,並列タスク処理を一回行って全体のジョブ処理が完了する場合に焦点を当て,通常の並列処理の応答時間性能と,各ワーカマシンが処理するタスクの複製を別のワーカマシンにも実行させるリプリケーション法の応答時間性能についての理論解析を行った.具体的には各ワーカマシンにおけるタスク処理時間を独立同一な分布に従うと仮定し,通常並列処理ではタスク処理時間の最大値が従う分布を考え,一方リプリケーション法では同一タスクを二台のワーカマシンで並列実行して早く終了した方の処理時間をタスク処理時間としたときのジョブ応答時間分布の導出を行った.ワーカマシン単体でのタスク処理時間の確率分布として,ワイブル分布とパレート分布に着目し,二つの分布に対する平均応答時間の陽公式を導出した.数値例より,タスク処理時間の分散が大きいほどリプリケーション法の方が応答時間を短縮できること,タスク処理時間がパレート分布に従うときはワーカマシン数が大きいときほどリプリケーション法が効果的になることが確認された. 次に極値理論を応用し,ワーカマシン台数が非常に大きくなったときの平均応答時間の漸近公式を,通常並列処理とリプリケーション処理の二つについて導出した.数値実験において厳密解と漸近公式の値を比較した結果,台数がそれほど大きくない場合でも両者がかなりの精度で一致することが判明し,極値理論によるアプローチの有効性を確認することができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初予定の研究を遂行し,研究成果を学術論文誌1編,国際会議論文1編,国内研究会4編として発表することができた.
|
今後の研究の推進方策 |
Googleの代表的なソフトウェアサービスフレームワークであるMapReduceでは,ジョブレベルの応答性能を劣化させる落伍者の問題に対処するため,個々のタスクの処理状況をステップ単位で管理し,ある閾値以上の処理時間が経過しても終了しないタスクの残りステップを別のワーカマシンにも並列的に処理させることで,全体のジョブ応答時間の短縮化を図るバックアップタスクと呼ばれる性能改善手法を導入している.ここでは単一の並列タスク処理に対するバックアップタスクの性能改善効果について,極値理論に基づくジョブ応答時間の漸近分布解析を行う.具体的には,各ワーカマシンにおけるタスク処理時間に対して閾値を設け,タスク処理を行っているワーカマシン群の内,タスク処理にかかる時間が閾値を超えたワーカマシンに対してそのタスク全体の複製を代替ワーカマシンで実行させる場合を検討する.このモデルに対して極値理論に基づくジョブ応答時間の漸近分布解析を行い,タスク処理時間に対する閾値が全体のジョブ応答時間に与える影響を数値実験により精査する.一方,処理を行ったすべてのワーカマシンのタスク処理時間を積算した総タスク処理時間はワーカマシン群で消費される総電力量と密接に関連することから,総タスク処理時間分布についても解析を行い,ジョブ応答時間と総消費電力量の間のトレードオフ関係に与えるタスク処理時間閾値の影響についても数値実験を通して徹底的に調査を行う.
|