研究領域 | スパースモデリングの深化と高次元データ駆動科学の創成 |
研究課題/領域番号 |
26120530
|
研究機関 | 九州大学 |
研究代表者 |
藤澤 克樹 九州大学, マス・フォア・インダストリ研究所, 教授 (40303854)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | 数理最適化 / グラフ探索 / ビッグデータ / ハイパフォーマンス・コンピューティング / オペレーションズ・リサーチ / 並列計算 / ソフトウェア / 省電力化 |
研究実績の概要 |
研究期間内の主要目的は主に以下の二つである 1.最新の計算機アーキテクチャ上でのスパースデータの多階層メモリへの配置手法及び高速かつ省電力計算手法の開発と検証 2.1の技術を活用したソフトウェア実装方式の提供及びグラフ探索及び数理最適化用のソフトウェアの開発及び当該領域研究者への提供 1に関しては最新の計算機アーキテクチャとして主に NUMA(Non-Uniform Memory Access)を想定している。スパースデータによる重要なアプリケーションとしてグラフ探索に取り組んでいるが、26年度は主としてメモリ配置の高速化及び省電力化に成功した。 具体的にはグラフ接続行列に対する局所的なデータ配置及びメモリアクセスパターンの改善によって、グラフ探索の主要な部分におけるノード間通信の大幅削減に成功した。またこの改善によって、グラフ探索の大幅な高速化と省電力化にも成功した。また2に関しては、次に示すソフトウェアの開発を行っている(平成27年度に公開予定)。グラフ探索では ULIBC: CPUアフィニティやローカルメモリの確保を容易に行うためのライブラリ。NETAL: 計算機のメモリ階層構造を考慮したグラフ処理ライブラリ(最短路計算、ネットワーク内での各点の重要度を推定。各点の広域内における影響 (情報の伝播力)の開発を進めている。また数理最適化に関しては SDPARA の開発を行い、大規模な数理最適化問題 (半正定値計画問題: SDP) に対する並列ソルバの開発と評価。計算量とデータ移動量の正確な推定、疎性やサイズなどのデータ特性と性能値の見極め等のアルゴリズムを開発することによって、世界最高性能の並列ソルバの開発に成功し、東工大スパコン TSUBAME2.5上で1.73PFlops(4080GPU)を達成した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
データ構造の工夫とグラフの特性を考慮した探索アルゴリズムの開発により、計算量と通信データ量の削減に成功し、またメモリの多階層化を考慮することによって、高速性と省電力性を両立したアルゴリズムに提案と評価を行った(第3、4回 Green Graph 500 ベンチマーク(http://green.graph500.org)において世界1位の省電力性能を達成した)。 また、研究実績の概要にも記載したように、大規模な数理最適化問題 (半正定値計画問題: SDP) に対する並列ソルバの開発を行い、極めて高い性能を達成している。
|
今後の研究の推進方策 |
今後登場するポストペタスパコン上では計算コア数の増大、メモリバンド幅の不足などによって、これまでの技術の延長では最大 100 万規模の並列環境ではソフトウェアの性能を発揮できないことが予想される。そこで本研究では、最初にポストペタスパコン上での超高性能最適化ソフトウェアを実現するための技術的課題を特定し、以下の技術を世界に先駆けて確立する。 ①入力データの特徴(大小, 密や疎)を把握し、計算量の推定によるデータ構造と計算方法の自動選択及び少ないメモリバンド幅でも高性能を発揮する疎データに対する高速計算エンジンの開発 ②大規模並列環境下における分枝限定法の分枝木の生成及び高速列挙技術。また研究期間の後期では予想され得る実データの大規模化及び複雑化に対処可能な技術の確立を目指し、実データを用いてポストペタスパコン上で大規模な実証実験を行う。 さらに平成26年度の成果である最新の計算機アーキテクチャ上でのスパースデータの多階層メモリへの配置手法及び高速かつ省電力計算手法を活用して、以下のソフトウェア開発とライブラリ公開を推進する。1: ULIBC: CPUアフィニティやローカルメモリの確保を容易に行うためのライブラリ。2: NETAL: 計算機のメモリ階層構造を考慮したグラフ処理ライブラリ(最短路計算、ネットワーク内での各点の重要度を推定。各点の広域内における影響 (情報の伝播力)。3: SDPARA ソルバ: 大規模な数理最適化問題 (半正定値計画問題: SDP) に対する並列ソルバの開発と評価。計算量とデータ移動量の正確な推定、疎性やサイズなどのデータ特性と性能値の見極め等のアルゴリズムを開発することによって、世界最高性能の並列ソルバの開発に成功し、東工大スパコン TSUBAME2.5上で 1.73PFlops(4080GPU)を達成した。
|