研究実績の概要 |
現在,高性能計算に用いられるスーパーコンピュータ(スパコン)では,複数のCPUやGPUとメモリから成る計算ノードを,多数,高速ネットワークで接続し,超並列計算を実現して高速処理を行なっている,しかし,多数の計算ノードはそれぞれ独立のメモリとアドレス空間を持ち,他の計算ノードのメモリにあるデータ(遠隔データ)をアクセスするには,ローカルメモリにあるデータアクセスとは異なるプログラム技法(プログラムインターフェース)を取らざるを得ない.一つの計算ノードに入りきらない大規模データを,多数の計算ノードのメモリに分散して配置し,これを多数の計算ノードにより並列処理する場合,プログラムの記述は非常に複雑になり,アルゴリズムやプログラム開発において大きな負担となっている. このような分散メモリ型の超並列計算システムにおいて,プログラム開発の生産性を高め,高性能処理を可能にするため,巨大な大域共有メモリ(大規模仮想アドレス空間)を実現するランタイムシステムmSMSを開発し,ローカル/リモートメモリの区別なくデータにアクセスできるプログラミング環境を構築した. これまで,東工大Tsubame3.0,東大Reedbushスパコンなどにおいて,大規模アドレス空間(30TiB)における大域共有データに超並列(9900コア)ステンシル計算を行い,従来手法に比べ,容易にプログラム開発ができるだけでなく,高い性能を得た.さらに,各計算ノードの CPUだけでなくGPUも利用できるように,既存のプログラムインターフェース(OpeMP,OpenACC, CUDA)と自由に組み合わせてプログラム記述ができるハイブリッドプログラミング環境を実現した. 今年度は,東大のOakbridge-CXスパコンにおいてmSMSを稼働し,移植性の高さも確認した.
|