研究概要 |
大規模環境では必然となるヘテロジニアス環境での性能モデリングとそれを応用したスケジューリングについて、以下の成果を得た。 ・モデル適合化技術(主担当・中島):性能モデル適合の基本となる通信性能モデルの構築と詳細な解析によって、システムアーキテクチャと通信ライブラリの不適合がしばしば生じていることが明らかになった。MPIなどの通信ライブラリは一般に、集合通信のアルゴリズムをメッセージサイズや通信に関与するプロセス数によって切り替えている。この切替戦略は多くの揚合、プロセッサの演算性能やメモリ転送性能が結合網の通信性能を大きく上回ることなどを前提としているが、最近のマルチコア化や高速結合網の出現によりこれらの前提が崩れつつある。その結果、不適切なアルゴリズム、たとえば長大なメッセージの細分化などにより、モデルが予測する性能に比べて1桁近い劣化が生じていることが明らかになった。 ・モデルベーススケジューリング方式(主担当・大野):10^5スケールの大規模な並列タスク群を、10^4スケールの大規模かつ広域分散した計算環境上で効率的に実行するためのスケジューリング方式として、タスクネットワークと計算環境の構造の双方の階層性に着目した階層的スケジューリング方式を考案・実装・評価した。またこのような大規模タスクを扱うために、MegaScriptの実装を改良してタスクやタスクネットワークを縮約表現するメカニズムを導入した。これらを、100,000タスクからなる種々のタスクネットワークと10,000計算ノードからなる3階層の計算環境を対象に評価した結果、優れた動的スケジューリング方式として知られているOLBに対して20%以上の性能向上が達成され、また大規模タスクネットワークをタスク数によらない定数オーダで表現・処理できることが確認された。
|