研究課題/領域番号 |
25330144
|
研究機関 | 工学院大学 |
研究代表者 |
田中 輝雄 工学院大学, 情報工学部, 教授 (90622837)
|
研究分担者 |
長谷川 秀彦 筑波大学, 図書館情報メディア研究科(系), 教授 (20164824)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 4倍精度演算 / 倍々精度演算 / 反復計算ライブラリ / 疎行列計算 / 自動チューニング / マルチコア / ベクトル演算 / AVX |
研究実績の概要 |
収束性の改善と高速性の両立させるために、高精度演算を用いた疎行列を対象とした大規模反復計算ライブラリの実現を目指す。その第1ステップとして、マルチコア環境での4倍精度演算の実用化を研究している。本研究では、第1に、進化しつつあるインテル社ベクトル機能の特性を明らかにし、そのプロセッサ・アーキテクチャを駆使して、CPU性能の極限を追求した4倍精度演算処理の実現をはかる。なお、本研究では、4倍精度演算を倍々精度演算で実装した。 【課題1:インテル新アーキテクチャでの4倍精度演算の実装と高速化】に対しては、数値計算ライブラリLisをベースに、倍々精度演算機能をインテル社アーキテクチャAVX2向けに改良し、新たな数値計算ライブラリを構築し、β版として公開した。 【課題2:通信量削減方式の実装と高速化】に対しては、SMP型計算機に向け、キャッシュのr利用効率を上げることにより、性能を高めたMatrix Power Kernel(疎行列Aに対してA*A*…*Aの演算を高速に行う)を実装し、その効果を実証した。また、反復法におけるチェビシェフ多項式を用いた、計算ノード間のデータ通信頻度を削減する方式について研究を進め、その解法の収束挙動が、チェビシェフ多項式を用いない従来の解法に対して、高並列環境でさらに高い並列化効率を得ることができることを確認した。 関連発表として、論文「AVX2を用いた倍精度BCRS形式疎行列と倍々精度ベクトル積の高速化」が1件採録となった。また、国際学会(査読有)にて1件、国内学会にて、査読有が1件、査読無が9件の発表を行なった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度の目標である【計画1】【計画2】を推進した. 【計画1】「AVXおよび新Xeon上でのさらなる拡張機能を用いた4倍精度のプロトタイプ作成」については,数値計算ライブラリLisをベースに,AVX2向け4倍精度演算(実装は,倍々精度演算)の実装を行い,新数値計算ライブラリを構築し,β版を公開した.新Xeon向けには,特性評価を実施した. 【計画2】「通信量削減を目的とする新しいアルゴリズムの開発・実装」については,SMP型計算機に向け、キャッシュの効率を上げることにより、性能を高めたMatrix Power Kernel(疎行列Aに対してA*A*…*Aの演算を高速に行う)を実装し、その効果を実証した。また、反復法におけるチェビシェフ多項式を用いた、計算ノード間のデータ通信頻度を削減する方式について研究を進め、その解法の収束挙動が、チェビシェフ多項式を用いない従来の解法に対して、高並列環境でさらに高い並列化効率を得ることができることをスーパコンピュータ京を用いて確認した。
|
今後の研究の推進方策 |
【課題1:インテル新アーキテクチャでの4倍精度演算の実装と高速化】に対しては、 開発したAVX2対応の数値計算ライブラリを公開し、いろいろな応用に適用し、フィードバックを受け、改善に努める(27年度)。 【課題2:通信量削減方式の実装と高速化】に対しては、反復法におけるチェビシェフ多項式を用いた、計算ノード間のデータ通信頻度を削減する方式に、Matrix Power Kernelの技法を組み込む(27年度)。 さらに、【課題3:自動チューニング技術の適用」】に向けて、課題1の特性評価をもとに、倍精度演算と倍々精度演算から成る実行時自動チューニング機構の組み込むを行なっていく(27、28年度)。
|
次年度使用額が生じた理由 |
次世代AVX2およびメニーコアのプロセッサが来年以降に市場に出るので、現在は、手持ちのAVX2およびメニーコアのプロセッサを用いて、アルゴリズム、ライブラリの開発を先に進める。
|
次年度使用額の使用計画 |
本年度は、アルゴリズムの開発を進め、その成果を海外を含む学会などで公開する。そのための費用として用いる。また、新AVXあるいはメニーコア・プロセッサの購入については、新製品の状況(スペック、現システムとの差分)およびHPC関連の大型計算センタの導入状況も鑑みて、研究計画推進に沿った成果を出すことを目標に実施する。
|