2013 Fiscal Year Annual Research Report

次世代超並列流体計算のためのメモリボトルネックの無いスケーラブル計算機の研究

Research Project

Project/Area Number	23300012
Research Institution	Tohoku University
Principal Investigator	佐野健太郎東北大学, 大学院・情報科学研究科, 准教授 (00323048)
Co-Investigator(Kenkyū-buntansha)	佐々木大輔金沢工業大学, 工学部, 講師 (60507903) 山本悟東北大学, 情報科学研究科, 教授 (90192799)
Project Period (FY)	2011-04-01 – 2015-03-31
Keywords	高性能計算 / 計算機アーキテクチャ / 数値流体力学 / アクセラレータ / リコンフィギャラブル計算 / FPGA
Research Abstract	当該年度では、以下を実施した。【１．密結合FPGAクラスタおよびその開発環境の改良】　前年度開発をした密結合FPGAクラスタに対し、安定動作および開発効率向上のための改良を行った。クラスタに無停電電源装置を追加した他、FPGAボードを４枚搭載した計算ノード内に温度計を設置して稼動時の温度上昇を確認し、長時間の実用計算にも耐え得るシステムを構成した。また、各FPGA上に実装するアクセラレータフレームワークについて、昨年度開発した基本設計を拡張し、特に10Gイーサネット(10GE)ネットワークを経由して他のFPGAボード上のDDR3メモリにデータを書込むための、リモートメモリライトモジュールを開発した。これを10GEのIPコアと併せてフレームワーク上に実装し、実機上で動作確認を行った。また、複数のユーザにより遠隔でFPGA上のハードウェア開発を行うための、サーバ環境の整備を行った。【２．BCMアクセラレータの計算コアの試作実装と評価】　前年度基本設計を行った計算コア「キューブエンジン（CE)」について、浮動小数点の多段計算パイプラインを実装し、FPGA上でその動作を確認した。データストリームに対してメモリボトルネックを回避し高スループットの流体計算を行うために、ステンシルバッファIPコアを開発しCEに組み込んだ。【３．通信アルゴリズムの改良】　従来のBCMによる並列計算では小規模のデータ通信が頻発しFPGAクラスタ上で高い性能向上が見込めなかったため、近似計算にはなるもののデータ通信をまとめて効率化を図る通信アルゴリズムを考案した。また、簡単な２次元流体計算を模擬するソフトウェアにより、時間刻みが十分に小さければ改良版通信アルゴリズムでも計算誤差が非常に小さく抑えられることを確認した。また、この通信アルゴリズムを実装するための通信および制御機構の基本設計を行った。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本研究では、最終的に、試作実装を通じて実用問題に対する並列計算の性能評価を行うことを目的としている。これに対し、密結合FPGAクラスタとその開発環境、およびFPGA上に実装する基本アクセラレータフレームワークおよびドライバ・ライブラリソフトウェアがほぼ完成していることに加え、各FPGA上に実装するBCMの計算コア（キューブエンジン,CE）についてもその試作実装を終えていることから、研究開発は順調である。加えて、FPGA間のデータ通信を効率良く実現するためのリモートメモリライトモジュールの開発や、データ通信を効率化する改良版アルゴリズムの考案も行っており、全体として動作するシステムの完成に向けて、必要となる基本要素の開発も順調に進んでいる。複数のFPGAに対して並列に計算を実行させるためのホスト計算機上の並列ソフトウェア開発を、現在進めているところである。既存のBCMソフトウェアは殆どがFORTRANで書かれておりFPGAを駆動させる機能を追加するのが困難であるため、C++言語によりBCM並列計算ソフトウェアを１から新規に開発している。このソフトウェアおける計算処理をFPGA上のハードウェアにオフロードすることにより、リコンフィギャラブルアクセラレータを用いた高性能計算を実現しようとしているところである。
Strategy for Future Research Activity	今後は、BCMアクセラレータシステム全体の完成と、超並列流体計算のためのスケーラブル計算機の評価のために、以下を実施する予定である。【１．BCM計算ノードの完成】　前年度開発をしたキューブエンジン(CE)、リモートメモリライトモジュール(RemoteMM)、改良版データ通信機構を組み合わせて、高速計算とそれに伴うデータ通信が可能なBCM計算ノードを構成し、FPGA上に実装する。本ノードでは、ソフトコアプロセッサであるNIOS IIプロセッサを用い、ハードウェアモジュールに対する計算と通信の制御といったあまり高性能な処理が求められない部分をファームウェアとして実装する。【２．複数ノードによる並列計算の実施】　複数のFPGAに実装した１の計算ノードに対し、並列にBCM計算を実行するための並列ソフトウェアを開発する。FPGAクラスタを構成する複数のPCノード上で並列に動作し、FPGA上のBCM計算ノードとデータの入出力を行いながら計算の開始を制御したり途中の計算結果を読み出し可視化や保存を行うためのソフトウェアを実装する。併せて、アクセラレータによる計算の検証のために、ソフトウェアによるBCM並列流体計算も実装を行う。【３．性能評価と設計の改良】　１，２を通じて、最終的には、３次元の実用規模の問題を実機にて計算し、性能や消費電力等を評価する。リコンフィギャラブルアクセラレータを用いることにより、メモリボトルネックが回避できかつ台数効果が向上可能なことについて、知見を得る。また、得られた結果を設計と実装にフィードバックし、研究期間の限りその性能向上のための工夫・改善を行う。

Research Products
(24 results)

All 2014 2013 Other

All Journal Article (14 results) (of which Peer Reviewed: 5 results) Presentation (10 results) (of which Invited: 1 results)

[Journal Article] Efficient Custom Computing of Fully-Streamed Lattice Boltzmann Method on Tightly-Coupled FPGA Cluster2014
- Author(s)
  Kentaro Sano, Yoshiaki Kono, Hayato Suzuki, Ryotaro Chiba, Ryo Ito, Tomohiro Ueno, Kyo Koizumi, and Satoru Yamamoto
- Journal Title
  
  ACM SIGARCH Computer Architecture News
  
  Volume: 印刷中 Pages: 印刷中
- Peer Reviewed
[Journal Article] Multi-FPGA Accelerator for Scalable Stencil Computation with Constant Memory-Bandwidth2014
- Author(s)
  Kentaro Sano, Yoshiaki Hatsuda, and Satoru Yamamoto
- Journal Title
  
  IEEE Transactions on Parallel and Distributed Systems
  
  Volume: 25(3) Pages: 695-705
- DOI
  DOI: 10.1109/TPDS.2013.51
- Peer Reviewed
[Journal Article] Bandwidth Compression of Multiple Numerical DataStreams for High Performance Custom Computing2014
- Author(s)
  Tomohiro Ueno, Ryo Ito, Kentaro Sano, and Satoru Yamamoto
- Journal Title
  
  Proceedings of the International Conference on Application-specific Systems, Architectures and Processors
  
  Volume: 印刷中 Pages: 印刷中
- Peer Reviewed
[Journal Article] FPGA-based Custom Computing Architecture for Large-Scale Fluid Simulation with Building Cube Method2014
- Author(s)
  Kentaro Sano, Ryotaro Chiba, Tomoya Ueno, Hayato Suzuki, Ryo Ito and Satoru Yamamoto
- Journal Title
  
  ACM SIGARCH Computer Architecture News
  
  Volume: 印刷中 Pages: 印刷中
- Peer Reviewed
[Journal Article] FPGA-based Scalable Custom Computing Accelerator for Computational Fluid Dynamics based on Lattice Boltzmann Method2014
- Author(s)
  Kentaro Sano
- Journal Title
  
  Proceedings of the 18th Workshop on Sustained Simulation Performance
  
  Volume: 印刷中 Pages: 印刷中
[Journal Article] ストリーム計算のための高位合成コンパイラの設計と実装2014
- Author(s)
  伊藤涼, 鈴木隼人, 千葉諒太郎, 佐野健太郎, 山本悟
- Journal Title
  
  電子情報通信学会リコンフィギャラブルシステム研究会信学技法
  
  Volume: 113(418) Pages: 1-6
[Journal Article] 複数ストリームのための帯域圧縮ハードウェアの実装と評価2014
- Author(s)
  上野知洋, 伊藤涼, 佐野健太郎, 山本悟
- Journal Title
  
  電子情報通信学会リコンフィギャラブルシステム研究会信学技法
  
  Volume: 113(418) Pages: 131-136
[Journal Article] Parallel and Scalable Custom Computing for Real-Time Fluid Simulation on a Cluster Node with Four Tightly-Coupled FPGAs2013
- Author(s)
  Kentaro Sano, Ryo Ito, Hayato Suzuki and Yoshiaki Kono
- Journal Title
  
  Proceedings of the 23rd International Conference on Field-Programmable Logic and Applications
  
  Volume: - Pages: DS_7(1 page)
- Peer Reviewed
[Journal Article] Cartesian-based CFD Solver for Low-Reynolds Number Airfoils2013
- Author(s)
  Daisuke Sasaki, Yuya Kojima, Tatsuya Kuroda, Takeshi Akasaka, Masato Okamoto, Koji Shimoyama, and Shigeru Obayashi
- Journal Title
  
  Proceedings of the 10th International Conference on Flow Dynamics
  
  Volume: - Pages: OS2-14(2 pages)
[Journal Article] 複数データストリームの帯域向上のための圧縮ハードウェアの実装と評価2013
- Author(s)
  上野知洋, 高野芳彰, 佐野健太郎, 山本悟
- Journal Title
  
  電子情報通信学会リコンフィギャラブルシステム研究会信学技法
  
  Volume: 113(52) Pages: 13-18
[Journal Article] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価2013
- Author(s)
  千葉諒太郎, 鈴木隼人, 伊藤涼, 佐野健太郎, 山本悟
- Journal Title
  
  電子情報通信学会リコンフィギャラブルシステム研究会信学技法
  
  Volume: 113(221) Pages: 13-18
[Journal Article] 密結合FPGAクラスタによる格子ボルツマン法専用流体計算機の性能評価2013
- Author(s)
  伊藤涼, 鈴木隼人, 千葉諒太郎, 佐野健太郎, 山本悟
- Journal Title
  
  第27回数値流体力学シンポジウム講演論文集
  
  Volume: - Pages: D06-4(4 pages)
[Journal Article] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価2013
- Author(s)
  千葉諒太郎, 鈴木隼人, 伊藤涼, 佐野健太郎, 山本悟
- Journal Title
  
  第27回数値流体力学シンポジウム講演論文集
  
  Volume: - Pages: D06-3(6 pages)
[Journal Article] 六目並べハードウェアデザインコンテストへの挑戦2013
- Author(s)
  佐野健太郎
- Journal Title
  
  電子情報通信学会リコンフィギャラブルシステム研究会信学技法
  
  Volume: 113(52) Pages: 1-6
[Presentation] FPGA-based Scalable Custom Computing Accelerator for Computational Fluid Dynamics based on Lattice Boltzmann Method
- Author(s)
  Kentaro Sano
- Organizer
  18th Workshop on Sustained Simulation Performance
- Place of Presentation
  High Performance Computing Center Stuttgart (HLRS), Universitｔ Stuttgart, Germany
[Presentation] 六目並べハードウェアデザインコンテストへの挑戦
- Author(s)
  佐野健太郎
- Organizer
  電子情報通信学会リコンフィギャラブルシステム研究会 (基調講演)
- Place of Presentation
  高知県民文化センター
- Invited
[Presentation] 次世代ペタスケールCFDのアルゴリズム研究
- Author(s)
  佐々木大輔
- Organizer
  学際大規模情報基盤共同利用・共同研究拠点第5回シンポジウム
- Place of Presentation
  品川グランドセントラルタワー
[Presentation] Efficient Custom Computing of Fully-Streamed Lattice Boltzmann Method on Tightly- Coupled FPGA Cluster
- Author(s)
  Kentaro Sano
- Organizer
  International Symposium on Highly-Efficient Accelerators and Reconfigurable Technologies
- Place of Presentation
  The University of Edinburgh, United Kingdom
[Presentation] 複数データストリームの帯域向上のための圧縮ハードウェアの実装と評価
- Author(s)
  上野知洋
- Organizer
  電子情報通信学会リコンフィギャラブルシステム研究会
- Place of Presentation
  高知県民文化センター
[Presentation] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価
- Author(s)
  千葉諒太郎
- Organizer
  電子情報通信学会リコンフィギャラブルシステム研究会
- Place of Presentation
  北陸先端科学技術大学院大学
[Presentation] 密結合FPGAクラスタによる格子ボルツマン法専用流体計算機の性能評価
- Author(s)
  伊藤涼
- Organizer
  第27回数値流体力学シンポジウム
- Place of Presentation
  名古屋大学
[Presentation] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価
- Author(s)
  千葉諒太郎
- Organizer
  第27回数値流体力学シンポジウム
- Place of Presentation
  名古屋大学
[Presentation] ストリーム計算のための高位合成コンパイラの設計と実装
- Author(s)
  伊藤涼
- Organizer
  電子情報通信学会リコンフィギャラブルシステム研究会
- Place of Presentation
  慶應義塾大学日吉キャンパス
[Presentation] 複数ストリームのための帯域圧縮ハードウェアの実装と評価
- Author(s)
  上野知洋
- Organizer
  電子情報通信学会リコンフィギャラブルシステム研究会
- Place of Presentation
  慶應義塾大学日吉キャンパス

2013 Fiscal Year Annual Research Report

次世代超並列流体計算のためのメモリボトルネックの無いスケーラブル計算機の研究

Principal Investigator

佐野 健太郎 東北大学, 大学院・情報科学研究科, 准教授 (00323048)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Efficient Custom Computing of Fully-Streamed Lattice Boltzmann Method on Tightly-Coupled FPGA Cluster2014

Author(s)

Journal Title

[Journal Article] Multi-FPGA Accelerator for Scalable Stencil Computation with Constant Memory-Bandwidth2014

Author(s)

Journal Title

DOI

[Journal Article] Bandwidth Compression of Multiple Numerical DataStreams for High Performance Custom Computing2014

Author(s)

Journal Title

[Journal Article] FPGA-based Custom Computing Architecture for Large-Scale Fluid Simulation with Building Cube Method2014

Author(s)

Journal Title

[Journal Article] FPGA-based Scalable Custom Computing Accelerator for Computational Fluid Dynamics based on Lattice Boltzmann Method2014

Author(s)

Journal Title

[Journal Article] ストリーム計算のための高位合成コンパイラの設計と実装2014

Author(s)

Journal Title

[Journal Article] 複数ストリームのための帯域圧縮ハードウェアの実装と評価2014

Author(s)

Journal Title

[Journal Article] Parallel and Scalable Custom Computing for Real-Time Fluid Simulation on a Cluster Node with Four Tightly-Coupled FPGAs2013

Author(s)

Journal Title

[Journal Article] Cartesian-based CFD Solver for Low-Reynolds Number Airfoils2013

Author(s)

Journal Title

[Journal Article] 複数データストリームの帯域向上のための圧縮ハードウェアの実装と評価2013

Author(s)

Journal Title

[Journal Article] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価2013

Author(s)

Journal Title

[Journal Article] 密結合FPGAクラスタによる格子ボルツマン法専用流体計算機の性能評価2013

Author(s)

Journal Title

[Journal Article] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価2013

Author(s)

Journal Title

[Journal Article] 六目並べハードウェアデザインコンテストへの挑戦2013

Author(s)

Journal Title

[Presentation] FPGA-based Scalable Custom Computing Accelerator for Computational Fluid Dynamics based on Lattice Boltzmann Method

Author(s)

Organizer

Place of Presentation

[Presentation] 六目並べハードウェアデザインコンテストへの挑戦

Author(s)

Organizer

Place of Presentation

[Presentation] 次世代ペタスケールCFDのアルゴリズム研究

Author(s)

Organizer

Place of Presentation

[Presentation] Efficient Custom Computing of Fully-Streamed Lattice Boltzmann Method on Tightly- Coupled FPGA Cluster

Author(s)

Organizer

Place of Presentation

[Presentation] 複数データストリームの帯域向上のための圧縮ハードウェアの実装と評価

Author(s)

Organizer

Place of Presentation

[Presentation] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価

Author(s)

Organizer

Place of Presentation

[Presentation] 密結合FPGAクラスタによる格子ボルツマン法専用流体計算機の性能評価

Author(s)

Organizer

Place of Presentation

[Presentation] フラクショナルステップ法に基づく非圧縮性流体計算専用ストリームプロセッサの設計と評価

Author(s)

佐野健太郎東北大学, 大学院・情報科学研究科, 准教授 (00323048)