研究概要 |
本研究では, CPUコア, GPUアクセラレータコア, FPGAアクセラレータコアを統合した,高性能計算向けの高速・低消費電力ヘテロジニアス計算プロセッサとそのプログラミング環境の実現を目的としている. 平成24年度の実績は以下の通りである. Intel CPUおよびNVIDIA社のGPUアクセラレータ, Altera社のFPGAをPCI Expressで接続したヘテロジニアス計算ノードを構築した. さらに,構築した計算ノード上に,具体的応用を実装した.FDTD法に基づく電磁界解析では,演算精度を保ったままGPU処理の並列性を最大限に引き出すために,単精度と倍精度を解析空間に合わせて適応的にハイブリッドで用いる手法を開発した.さらに,その手法に基づきFPGAによる固定小数点アクセラレータとGPUによる倍精度演算を組み合わせることにより,同一性能で消費電力を1/30に低減できるアーキテクチャを開発した.として,遺伝子配列を解析するDNAシーケンサーでは,現在主流であるBWT変換に基づく解析アルゴリズムをFPGAを用いて実装した.シーケンサーの処理では32ビット固定小数点で十分な精度が得られることに着目し,並列性を最大限に活用するアーキテクチャを開発した. また,ヘテロジニアスアーキテクチャの設計手法として,画像処理向けのメモリアロケーション手法(画像データとメモリモジュールのマッピング)を開発した.この手法では,外部メモリからアクセラレータのローカルメモリへのデータ転送を最小化しつつ,演算並列度を最大化することができるため,並列処理の最大の問題であるメモリボトルネックを解消でき,アクセラレータのコンパイラの基本処理として重要となる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画である,ヘテロジニアス計算ノードの構築は予定通り達成されている.また,具体的な応用のマッピングは,(1)遺伝子解析,(2)電磁界解析,(3)医療画像処理のうち(1),(2)はマッピングを実施した.(3)に関しては,アルゴリズムの開発を進めており,その成果は医療系の論文で発表している.以上のことから,おおむね当初の予定通り進展しているといえる.
|
今後の研究の推進方策 |
実際の応用例のマッピングを推進し,最適化手法の指針を得る.まず,遺伝子解析のアクセラレータにおいては,並列度を増やして実際のヒトゲノムを用いて速度評価を行う.医療系画像処理においては,CTデータからの3次元画像処理,学習に基づく人体構造のデータマイング等を計画している.
|