研究課題/領域番号 |
24500068
|
研究種目 |
基盤研究(C)
|
研究機関 | 九州大学 |
研究代表者 |
南里 豪志 九州大学, 情報基盤研究開発センター, 准教授 (70284578)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | CAF / 非ブロッキング集団通信 / 高性能計算 |
研究概要 |
本年度は、CAFからの利用を予定している非ブロッキング集団通信について、既存の実装例を調査するとともに、より低オーバヘッドによる実装を行い、それぞれの性能特性を調査した。非ブロッキング集団通信は、2012年11月に MPI3の仕様として正式に採用されたため、 MPIライブラリでの実装の評価は行えなかったが、Hoeflerらによって開発された MPI向け非ブロッキング集団通信ライブラリ LibNBCが公開されていたため、これを調査した。LibNBCは、集団通信中で呼び出される個々の一対一通信や計算をそれぞれタスクとして LibNBC内部のスケジューラに登録し、管理する。スケジューラは、タスク相互の依存関係に基づいて、実行可能なタスクを発行していく。このスケジューラを他の処理と並行して推進させる手段として LibNBCでは、別に専用のスレッドを立てる方法と、プログラマが推進のための関数を明示的にプログラム中に記述する方法の二通りを用意している。 この LibNBCの実装に対して我々は、スケジューラへの登録と管理を、集団通信内部の個々の通信や計算に分けるのではなく、集団通信単位で行うよう実装し、比較した。我々の実装は、スケジューリングオーバヘッドを低くすることを狙ったものである。ただし、LibNBCと違い、複数の非ブロッキング集団通信を同時に進行させることは出来ない。なお、我々の実装では、スケジューラの推進はスレッドを立てる方法のみとした。 九州大学情報基盤研究開発センターの高性能演算サーバを用い、Alltoall通信と行列積をオーバラップ実行するプログラムで性能を検証したところ、同時に発行された非ブロッキング集団通信が一つの場合、LibNBCでは通信隠蔽の効果が得られなかったのに対し、は我々の実装ではオーバラップの効果が得られることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度はCAFのベンチマークプログラムにおける通信の非ブロッキング集団通信への修正も行う予定であった。しかし、実験のために入手した LibNBCによる非ブロッキング集団通信の性能を調査したところ、スケジュール管理のためのオーバヘッドの影響により、性能が想定していたよりも低く、通信隠蔽による効果が得られなかった。このままでは計算と通信の通信隠蔽の評価が行えないため、他の実装も探したが、上記の通り MPI3の仕様確定が 11月と遅く、各 MPIライブラリでの提供の見通しも立っていなかったため、低オーバヘッドの実装を自分で行うこととした。この作業と、その後の LibNBCとの比較は、当初の計画になかったものであったため、CAFベンチマークプログラムの解析と修正はほとんど行えなかった。
|
今後の研究の推進方策 |
平成25年度は、今年度行うはずだったベンチマークプログラムの解析と非ブロッキング集団通信への変更を行い、通信隠蔽による効果の基礎評価を行う。なお、昨年度一緒に研究に取り組み、非ブロッキング集団通信に関するスキルを積んだ大学院生が今年度も在籍しているので、二人で共同して作業を進めることにより、平成25年度の目標であった通信隠蔽に向けたプログラム解析技術の確立を目指す。 また、最終年度は、その成果に基づいて、通信を隠蔽する計算部分を分離する技術を研究開発し、自動通信隠蔽技術の確立を目指す。
|
次年度の研究費の使用計画 |
本年度購入予定だったプログラム解析サーバを平成25年度に購入する予定である。また、昨年度得られた成果である非ブロッキング集団通信の実装と評価、および本年度の研究成果であるプログラム解析技術について、それぞれ国内および国外での発表を予定している。
|