2012 Fiscal Year Research-status Report
超大規模有限要素解析の実用化に向けたヘテロジニアス型分散メモリ並列反復法の開発
Project/Area Number |
24760062
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Nagoya University |
Principal Investigator |
荻野 正雄 名古屋大学, 情報基盤センター, 准教授 (00380593)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 領域分割法 / 並列有限要素法 / ヘテロジニアスコンピューティング / ハイパフォーマンスコンピューティング / 超大規模計算 / CPU-GPUハイブリッド並列処理 |
Research Abstract |
本年度は,ヘテロジニアス型計算機アーキテクチャとしてGPUを搭載した並列計算機を対象とし,領域分割型反復法の実装及び基礎的性能評価を行った.GPU向けには,CUDA,CUBLAS及びCUSPARSEを用いた共役勾配法の実装を行った.これにより,CPU1コアに比べて6倍の高速化に成功した.また,OpenMPの動的スケジューリング機能を用いたCPUマルチコアとGPUに対する動的負荷分散に成功した.これにより,非構造格子FEMのCPU-GPUハイブリッド並列計算に成功し,マルチコアCPUのみに比べて,マルチコアCPU-GPUハイブリッド計算によって約2倍の高速化に成功した. 次に,磁場解析を対象に,非正則や複素対称問題に対応した領域分割型反復法を開発した.大規模電磁界解析における反復法の収束性を数値実験で評価し,従来有効とされてきたCG法系よりもCR系に優位性がある知見が得られた.特に,非正則問題である非線形静磁場向けにDDM-MINRES法アルゴリズムを整備し,さらに,複素対称問題である高周波電磁場向けにDDM-CSMINRES法を開発し,それぞれにおいて収束性の改善と計算の高速化に成功した. また,計算機開発動向について調査し,メモリバンド幅性能が演算性能に比べて相対的に低下する可能性が高いことが得られた.よって,提案手法の要求B/F値を求め,複数の計算機で性能測定を行うことで,理論演算性能とメモリスループット値を用いた計算時間の予測が可能となった. さらに,100億自由度規模構造解析を目標として数値計算アルゴリズムを見直すことで,超大規模解析を実施した.特に,部分領域問題解析にEisenstat技法によるSSOR前処理付き反復法を適用するなど,省メモリ化及び実装最適化を行った.これにより,世界トップレベルとなる1,000億自由度規模解析に成功した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本研究は,エクサスケール級演算性能を持つスパコンによって解決されるべき課題で必要となる数兆から百兆自由度規模を実用時間内で実現する数値計算法の開発を行うものであり,最終目標として,数兆自由度規模モデルを用いた磁場構造連成解析の実現を目的としている.また,今後の大規模計算を支える計算機アーキテクチャの1つとして,異種演算装置の混在を想定し,ヘテロジニアスコンピューティングへの対応も行う. 超大規模解析として,本年度は現在のペタスケール級演算性能を持つスパコンを用いた1,000億自由度規模構造解析に成功し,将来の計算機による1兆自由度規模解析の実現性を示すことができた.また,超大規模解析で問題となる反復法の前処理について,2階層コースグリッド修正法に基づくBDD法による100億自由度解析に成功した.これらは非構造格子による有限要素解析としては世界トップレベルの規模であり,当初計画以上に進展している. ヘテロジニアスコンピューティングとして,Intel Xeon PhiなどのメニーコアCPU,NVIDIA TeslaなどのGPUが想定されるが,本年度はCPUとGPUのハイブリッド並列処理に成功するなど,おおむね順調にすすんでいる. 磁場構造連成解析システムの開発として,本年度は構造解析と比べて収束性が悪いことが知られている磁場解析向け領域分割型反復法の開発を行い,電磁場解析におけるCR系反復法の有効性に関する知見を示し,さらに,複素対称向けのCS-MINRES法を提案するなど,おおむね順調にすすんでいる.
|
Strategy for Future Research Activity |
平成25年度は,メニーコアCPUを持つ並列計算機環境向けの研究を行う.特に,CPUとメニーコアCPUで構成されたヘテロジニアス環境向け領域分割型弾塑性構造解析アルゴリズムの開発及び実装を行う.さらに,CPU,GPU並びにメニーコアCPUが混在した環境向けの研究も行う.これにより,本研究の基本アルゴリズムを確立する.さらに,本研究の実用化に向けて,強い非線形性を持つ構造解析向け反復法を開発する.また,1兆自由度規模解析の試解析を実施し,定式化の見直しについて検討する. 平成26年度は,ヘテロジニアス型分散メモリ並列に適したBDD前処理法の開発を行い,開発システムの高速化を行う.また,超大規模解析向けの磁場構造連成解析システム構築に関する研究を行う.なお,BDD前処理で十分な並列効率が得られない場合は,その他の前処理手法開発,領域分割型反復法の並列効率や収束性改善を行い,ヘテロジニアスコンピューティング向け数値計算アルゴリズムの基礎技術構築を確実に行っていく.また,1兆自由度規模解析の本解析を実施する. 平成27年度は,ヘテロジニアス型スパコンを用いて,1兆自由度規模モデルの磁場構造連成解析を実施する.また,メモリの混在・階層構造向け領域分割型反復法の開発及び実装を行うことで,さらなる高速化を実現する.さらに,100兆自由度規模解析実現に向けた研究を推進する.これにより,エクサスケール級スパコン並びにその後を見据えた並列反復法について提案する. なお,本研究における成果は,オープンソースソフトウェアとして整備し,一般公開することで社会への還元を行う.
|
Expenditure Plans for the Next FY Research Funding |
プログラム開発環境として占有可能なメニーコアCPU計算機並びにコンパイラ等の開発環境を導入し,研究の高効率化を行う.また,大規模計算の実験には,全国共同利用の計算資源を利用する. 研究成果の発表として,国内会議における研究発表や学術論文誌への投稿を行う.また,12月にシンガポールで開催される計算力学に関する国際会議APCOMにおいて研究発表を行う.
|
Research Products
(21 results)