2019 Fiscal Year Research-status Report
メニーノード多階層メモリを統合する高汎用メモリシステムの研究
Project/Area Number |
18K11327
|
Research Institution | Seikei University |
Principal Investigator |
緑川 博子 成蹊大学, 理工学部, 助教 (00190687)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 分散共有メモリシステム / クラスタ / メモリ / PGAS / マルチコア並列処理 / マルチノード並列処理 / 遠隔メモリ |
Outline of Annual Research Achievements |
マルチノードにおける高性能,高生産性メモリランタイムシステムmSMSの研究を進めた.昨年開発したSMint(OpenMPと同様な,mSMSのディレクティブベースAPI)と,他の代表的なPGAS言語であるUPCとXcalableMPについて,並列プログラム記述性と性能を,東工大Tsubame3.0(T3)上で評価した.この結果,他の言語に比較しプログラム行数が少なく,どのノードコアからも制限なくクラスタ上の大域データにアクセスが可能,大域データサイズに制限がない,従来のCポインタが利用できる,と多くの点において,SMint(mSMS)の記述性は優れており,さらに,ステンシル計算では,最も性能が高く,MPI性能と同等以上であった. mSMSとGPU を併用する実装実験では,T3とReedbush(東大)において,mSMSとマルチGPUを利用したプログラム(mSMS+OpenMP+OpenACC)が容易に記述でき,従来のOpenMPによるステンシル計算にくらべ,10倍以上の高速化が可能となった. mSMS応用では,Barnes-Hut(BH)アルゴリズムによる大規模N体問題を実装し,MPIでは記述の難しい,グローバルツリーをクラスタ上に構築し,64ノード(T3)により,質点数819M個を時間ステップ処理あたり45.52秒の成果を得た.データ規模と性能の点で,従来のUPCによる非常に複雑なBH実装による小規模な問題に比べ圧倒的な優位性を示し,従来のMPIに比べても同程度の性能が得られた.さらに,音響分析研究者との共同研究により,大規模FDTD処理がmSMSにより容易に記述でき高性能であるばかりか,境界条件などの複雑な指定においてmSMSによる記述が特に有用であると高い評価を得た
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
クラスタとGPU,CPUマルチコアを利用する並列処理において,ユーザの利用可能環境に合わせて,既存のOpenMP,OpenACC,などと自由に組み合わせ,並列処理記述が容易にできるAPIとその性能評価ができている. さらに応用に関しても,従来,クラスタにおけるプログラム記述が非常に複雑で,並列プログラム開発の生産性が低い処理についても,mSMS利用により, 共有メモリ向けのプログラムからシームレスに拡張して,クラスタでの処理ができるようになることを示せている. 不揮発性メモリなど新規メモリを想定した多階層メモリの利用は,予算的な制限もあり, 実施できない.
|
Strategy for Future Research Activity |
現在のBarnes-Hutの大規模処理についても,木の生成と力の計算において,異なるデータ分担方式をとる処理方式を構築中であり,不均一な分布による処理負荷のばらつきなどについての影響についても調査をすすめる. また,マルチGPUとmSMSを利用した高性能処理応用について,さらに多くの応用について適用をおこなう.
昨年度,応用分野の研究者にmSMSを提供して評価を得たので,2020年度は,多くの応用に実際に利用してもらい,そのフィードバックを得て,さらに高性能で利用しやすいシステムに変更していく予定である.このためには,mSMSのマニュアルを整備するとともに, ソフトウエアを公開し,チュートリアルなどの機会をつくることも重要であると考えている.
|
Causes of Carryover |
当初の研究計画では,2018年度に出荷予定であった新規不揮発性メモリであるintel 3D XPointメモリDIMMを搭載したサーバを購入して,実験を行う予定で,このサーバ購入費として200万円を申請していた.本研究申請時には,2018年には,3D XPointメモリDIMMを搭載サーバが出荷されると発表されていたが,実際には開発が遅れ,2018年度末時点でも,購入が不可能であった.このため,本実験が可能かどうかを見極めるため,2018年度の物品費は2019年度に残すようにした.しかし,本科研費交付額は,2018年度物品費が申請時の200万円から90万円にまで減額されており,事実上,新規メモリデバイスを搭載したサーバを購入するのは,難しい状況になった.(2019年5月時点で,最廉価でも150万円程度) このため2つの研究の柱のうち,マルチノード並列処理高速化のためのテーマを推進することにした. 分散共有メモリmSMSの新規APIの設計と実装に関し,一部,外部プログラマの力も借りる必要があり,人件費や外部発表の出張費も必要であるが,2019,2020年度の交付額は,70万円と限られているため,2018初年度の交付金を,2年度.3年度にまわして,研究に支障がないようにするためである.
|
Research Products
(7 results)