2020 Fiscal Year Research-status Report
プロセス間負荷分散のための可変スレッド環境を提供する革新的なライブラリの開発
Project/Area Number |
18K18059
|
Research Institution | The University of Tokyo |
Principal Investigator |
河合 直聡 東京大学, 情報基盤センター, 特任助教 (80780791)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 動的コア割り付け / 動的負荷分散 / ハイブリッド並列化 |
Outline of Annual Research Achievements |
本年度は、プロセス毎に割り付けるコア数を可変とする動的コア割り付け機構(Dynamic Core Binding : DCB ライブラリ)を、様々なアプリケーションに適用し、性能向上または消費電力削減の効果を評価した。最も高い効果を確認したのは格子H行列に適用した場合で、小規模な問題では最大で15.5%の計算時間短縮を、大規模な問題では計算時間の増加を1%以下に保ったまま、8%の消費電力削減を達成した。 DCBライブラリは、均一な負荷分散が困難なアプリケーション向けのライブラリであり、プロセス毎の演算量から割り付けるコア数を変更することで、コアまたはスレッド単位での演算量を均一化、計算時間短縮の効果が期待できる。実際に格子H行列法だけでなく、ICCG法やマルチグリッド法などの反復法でも一定の効果が得られた。ただし、メモリバンド幅律速な条件下では、プロセス毎の演算量を均一化しても計算時間短縮につながらないことが研究の成果として分かっている。そこで本年度は、メモリ律速なアプリケーションに対しては使用するコア数を減らすことで消費電力を削減する方向性を新たに見出した。メモリ律速なアプリケーションでプロセス毎のメモリ転送量が異なる場合には、コア毎のメモリ転送量が均一になるようにプロセス毎に使用するコア数を削減する。これにより、メモリバンド幅は同じように使い切っている状態を維持できるために、ほとんど計算時間を増加させることなく、使用するコア数の削減による低消費電力化が可能となった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本年度の研究では当初予定していたDCBライブラリによる均一な負荷分散の困難なアプリケーションの高速化だけでなく、消費電力削減の方向性も見出すことができた。 一方で、当初予定していたノード間の演算量を均一化する手法に関しては、組合せ最適化のパターンが非常に多くなる問題があり、適した組合せ最適化問題の解法や解き方についての検討に時間を要している。プロセス毎の演算量から各ノードに配置すべきプロセスの組合せは整数計画問題となるが、解くべき問題の係数行列は密行列となる。たとえば、1,000ノード、4,000プロセスを仮定すると、行列のサイズは160万要素に、10,000ノード、40,000プロセスを仮定すると16億要素となるため、その求解は容易ではない。現在はこの問題を解決するための検討に時間を要している。
|
Strategy for Future Research Activity |
ノード間の演算量の均一化のための組合せ最適化問題の解き方について、現在は様々なライブラリの適用可能性だけでなく、デジタルアニーラの使用も検討している。デジタルアニーラは組合せ最適化問題を解く新たなハードウェアとして近年着目されている。本研究ではデジタルアニーラを使用して大規模な組合せ問題をより高速に解くことも検討していく。 また、現在のDCBライブラリでは、与えられたパラメータに応じて、計算時間短縮を目的としてプロセス毎のコア数を変化させるか、消費電力削減を目的として減らすかをユーザーが選択するよう実装している。次年度の研究として、この切り替えを自動的に行うことを考えている。また、コアの割り付けの変更に関して、DCBは様々な環境変数を持っており、特にNUMA構成のハードウェアを想定したパラメータを用意している。これらのパラメータもユーザーが選択しているが、自年度はこれを自動的に選択するオートチューニング手法などの研究も行っていく。 加えて、理研の富岳スーパーコンピュータを始めとするA64FXコアを搭載したスーパーコンピュータが増えつつある。A64FXはメニーコアアーキテクチャの構成となっているため、DCBが活かせるシステムであると考えている。ただし、A64FXではCPU内にCMGと呼ばれる単位の区分があり、これらのCMGはNUMAとしてOSからは認識されており、A64FXに適したパラメータの選択なども重要となる。よって、A64FX上での適したパラメータの選択も含めて性能評価を行っていく予定である。
|
Causes of Carryover |
本年度の予算の使用では、国際学会、国内学会ともに全て新型コロナウイルスの影響でキャンセルとなり、旅費として形状していた予算がまったく使えない状況となった。 次年度は、研究推進のために、とくに在宅勤務を要求されている背景から、自宅からの研究を円滑に行うための設備として研究費を使用する予定である。
|