2021 Fiscal Year Research-status Report
プロセス間負荷分散のための可変スレッド環境を提供する革新的なライブラリの開発
Project/Area Number |
18K18059
|
Research Institution | The University of Tokyo |
Principal Investigator |
河合 直聡 東京大学, 情報基盤センター, 特任助教 (80780791)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | ロードバランシング / ハイブリッド並列化 / 動的負荷分散 / 低消費電力 |
Outline of Annual Research Achievements |
本研究では、プログラムの並列化に際して、多くのアプリケーションで発生する演算時間のアンバランスを、コアへの割付時に最適化し、全体の演算時間、消費電力削減を目的としている。 プログラムを並列化する場合には、プロセス並列を記述するMPIと、スレッド並列化を記述するpenMPの両方を使うことが多い。ここで、並列化で演算時間を短縮すためには、OpenMPとMPIの両方の並列単位で演算時間が均等な状態が望ましい。しかし、多くのアプリケーションで両方の並列単位での演算時間の均一化は困難である。本研究で開発しているDynamic Core Binding(DCB)ライブラリは、プロセス単位に割り当てるコア数を動的に決め、プロセス単位での演算時間の不均衡をスレッド(Core)単位で均一化した環境を提供する。これにより、演算時間短縮の効果が期待でき、またプロセス単位での負荷の不均衡が許容されるため、並列化のプログラミングコスト削減も可能となる。加えて、最も演算時間の長いプロセスに合わせて、それ以外のプロセスに割り付けるコア数を削減することで、全体で使用するコア数を削減、演算時間を伸ばすことなく、消費電力の削減も可能である。 実際に、演算時間の均等化が困難なアプリケーションに対して、DCBライブラリを適用し、東京大学情報基盤センターのスーパーコンピュータ、Oakbridge-CX(OBCX)で評価した結果、64ノードを使用した環境で最大15.6%の演算時間短縮を達成した。また、このOBCXを256ノード使用して消費電力削減の効果を評価した結果、最大で42.4%の削減効果を確認した。これは、消費電力を半減させたことに近く、良好な結果と言える。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、プロセス毎に割り付けるコア数を自由に変更できるライブラリ(DCBライブラリ)を初期に開発した。基本的な環境では、すべてのプロセス毎に割り付けられるコアは同じであり、これを任意に変更するためには、特殊なシステム関数の呼び出しが必要となる。DCBライブラリは、これを簡易なインターフェイスで可能としている。 研究開始時はこのDCBライブラリを使用して、演算時間短縮の効果を主に評価した。結果、メモリ律速なアプリケーションではその効果を得られず、演算律速なアプリケーションに限定されると判断した。しかし、メモリ律速なアプリケーションでは、逆にメモリアクセス量の少ないプロセスに割り付けるコア数を削減し、他のプロセスのメモリアクセスを確保することで、演算時間短縮が可能であることを新たに確認した。 加えて、演算時間の長いプロセスに合わせて他のプロセスに割り付けるコア数を削減し、消費電力を削減する方向性も新たに見出した。この結果、最大で42%の消費電力削減を達成した。
|
Strategy for Future Research Activity |
これまでの研究では、各ノード内の演算時間のみをみてコアの割付を変更している。従って、ノード内のコア割付は最適化されるが、ノード間の演算時間の均一化は達成できてない。今年度は、ノード間の演算時間を均一化するための最適なプロセスの割付に関する研究を行う。最適なプロセスの各ノードへの配置は、一般的な組み合わせ最適な問題として記述できる。ここで、解くべき組み合わせ最適化問題の解は整数に限定されるため、一般的な解法としては整数計画法が用いられるが、本研究で対象としている規模の問題を解く方法としては現実的ではない。本研究で解くべき最適化問題の自由度はノード数の定数倍であり、数千から数万がターゲットとなる。対して、整数計画法を用いて現実的な時間で解ける問題サイズは、検証した範囲では数百程度である。よって、異なるアプローチが必要となるため、本年度はデジタルアニーラの適用を検討する予定である。富士通が提供するデジタルアニーラは最大で100万ビット規模の問題を解け、これを利用して本研究で対象とする問題の求解を試みる。この解を元に、ノード間の計算時間の均一化、高速化を実現する予定である。
|
Causes of Carryover |
コロナウイルスの流行により、国際学会への参加が見送りとなったため。
|
Research Products
(1 results)