2016 年度実績報告書

大規模かつ高速な並列計算を支える高スケーラブルな並列入出力に関する研究

研究課題

研究課題/領域番号	25330148
研究機関	国立研究開発法人理化学研究所
研究代表者	辻田祐一国立研究開発法人理化学研究所, 計算科学研究機構, 開発研究員 (70360435)
研究期間 (年度)	2013-04-01 – 2017-03-31
キーワード	PCクラスタ / 並列入出力 / 並列ファイルシステム / MPI-IO / アグリゲータ
研究実績の概要	PCクラスタやスーパーコンピュータ等で広く利用されているMPIインタフェースにおける入出力インタフェースであるMPI-IOの代表的な実装であるROMIOに関して、プロセスのノード間・ノード内配置に配慮した実装の最適化に関する評価を昨年度から進めてきた。ROMIOでは入出力処理をプロセス群の一部あるいは全部に担当させて、並列に入出力を行わせており、この入出力を担当するプロセスをアグリゲータと呼んでいる。アグリゲータのノード間配置順に関して、並列ファイルシステムであるLustreのストライピング処理や、各ノードと並列ファイルシステム間の通信の混雑を回避した配置にすることで性能向上する可能性について昨年度内に検証試験と成果報告を完了させる予定であったが、使用していた東京工業大学のTSUBAME2.5の運用側から、評価プログラム実行時に並列ファイルシステムや通信回線に高い負荷がかかり、他の利用者への影響が大きいとして、繁忙期での使用を控えるよう連絡があり、計算機利用時期を年度末に遅らせた経緯があった。そこで、今年度に1年延長させて頂き、昨年度末に集中して実施した評価データの分析と成果報告を今年度に実施した。ここでそれまでの実装に対して、さらにアグリゲータにデータを集める処理での通信順を工夫することにより、通信の混雑を回避して性能向上に繋げることができることを確認した。昨年度の実施報告にもあるように、TSUBAME2.5の64ノードに768プロセスを起動したケースでは、現行のROMIOに対して67%の性能向上を確認している。得られたデータの精査・分析を進めた結果、同様に32ノードに384プロセスを起動したケースでも20%の性能向上が確認されており、通信順を配慮する実装の有用性が確認できた。

研究成果
(1件)

すべて雑誌論文 (1件) (うち査読あり 1件、謝辞記載あり 1件)

[雑誌論文] Topology-Aware Data Aggregation for High Performance Collective MPI-IO on a Multi-Core Cluster System2016
- 著者名/発表者名
  Yuichi Tsujita, Atsushi Hori, Toyohisa Kameyama, Yutaka Ishikawa
- 雑誌名
  
  Proceedings of 2016 Fourth International Symposium on Computing and Networking (CANDAR'16)
  
  巻: - ページ: 37-46
- DOI
  10.1109/CANDAR.2016.82
- 査読あり / 謝辞記載あり