• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

高度なGPUプログラミング手法の開拓

研究課題

研究課題/領域番号 23650012
研究機関東京工業大学

研究代表者

額田 彰  東京工業大学, 学術国際情報センター, 特任准教授 (40545688)

キーワードGPGPU / CUDA / FFT / InfiniBand / TSUBAME
研究概要

2006年にNVIDIA社が汎用計算向けのGPU環境としてCUDAを公開して以降、長い計算時間を要する多くの処理がGPUに移植され高速化を実現してきた。CUDAのプログラミング言語は既存のCやFortranを拡張したものであるが、多数のスレッドが同時に実行されユーザが定義したタスクを処理していくという固有のプログラミングモデルになっている。しかしながら言語は言語でしかなく、GPUのハードウェアを効果的に活用するためにはより踏み入ったプログラミング手法や最適化が必要となる。
大規模計算の場合には必然的に複数のノードに搭載される複数GPUを利用することになる。GPUは通常PCI-ExpressによってホストのCPUやメモリと接続されており、ノード間通信に用いられるInfiniBandネットワークアダプタなどもPCI-Expressで接続されている。あるGPUから他のノードのGPUへデータ転送するためにはホストを中継する必要がある。中でも3D-RISMなどの計算では複数GPUを利用して大規模な高速フーリエ変換を行う必要があるが、東京工業大学のスーパーコンピュータTSUBAME2.0を用いた実験では256ノードで既に性能が伸びないという問題が発生していた。これを解決するために数々の最適化手法を提案した。まずノード内のPCI-Express通信をうまくスケジューリングを行い、そしてノード内の複数GPUからの通信をホストで一旦束ねることによって、メッセージサイズが小さくなり転送効率が低下することを防止した。また大規模ネットワークでは通信が安定しないリンクが存在したり、他のユーザのジョブと通信が干渉して性能低下を引き起こす場合がある。この問題を回避するために各ノード間の通信性能を監視し、複数のInfiniBandネットワークリンクへの振り分けを変更することで徐々に混雑緩和へ向かうような自動最適化機能を提案した。これにより256ノードでもスケールするようになり、最大4.5TFの性能を達成した。

  • 研究成果

    (4件)

すべて 2014 2013

すべて 雑誌論文 (2件) 学会発表 (2件)

  • [雑誌論文] APU上の混合精度AMG法2013

    • 著者名/発表者名
      住吉 優希,長岡 駿希,藤井 昭宏, 額田 彰, 田中 輝雄
    • 雑誌名

      情報処理学会研究報告

      巻: 2013-HPC-141 ページ: 1-7

  • [雑誌論文] TSUBAME-KFC: 液浸冷却を用いたウルトラグリーンスパコン研究設備2013

    • 著者名/発表者名
      遠藤 敏夫,額田 彰,松岡 聡
    • 雑誌名

      情報処理学会研究報告

      巻: 2013-ARC-199/HPC-142 ページ: 1-6

  • [学会発表] I/O acceleration with GPU for I/O-bound Applications2014

    • 著者名/発表者名
      Kento Sato, Akira Nukada, Naoya Maruyama, Satoshi Matsuoka
    • 学会等名
      GPU Technology Conference 2014
    • 発表場所
      San Jose
    • 年月日
      2014-03-24
  • [学会発表] ウルトラグリーンスパコンTSUBAME2.5/TSUBAME-KFC2013

    • 著者名/発表者名
      遠藤 敏夫,額田 彰,松岡 聡
    • 学会等名
      大学ICT推進協議会2013年度年次大会講演論文集
    • 発表場所
      幕張メッセ
    • 年月日
      20131219-20131219

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi