2014 年度実施状況報告書

ベクトル演算と通信量削減によるマルチコア向け４倍精度反復法アルゴリズムの開発

研究課題

研究課題/領域番号	25330144
研究機関	工学院大学
研究代表者	田中輝雄工学院大学, 情報工学部, 教授 (90622837)
研究分担者	長谷川秀彦筑波大学, 図書館情報メディア研究科(系), 教授 (20164824)
研究期間 (年度)	2013-04-01 – 2017-03-31
キーワード	４倍精度演算 / 倍々精度演算 / 反復計算ライブラリ / 疎行列計算 / 自動チューニング / マルチコア / ベクトル演算 / AVX
研究実績の概要	収束性の改善と高速性の両立させるために、高精度演算を用いた疎行列を対象とした大規模反復計算ライブラリの実現を目指す。その第１ステップとして、マルチコア環境での４倍精度演算の実用化を研究している。本研究では、第１に、進化しつつあるインテル社ベクトル機能の特性を明らかにし、そのプロセッサ・アーキテクチャを駆使して、CPU性能の極限を追求した４倍精度演算処理の実現をはかる。なお、本研究では、４倍精度演算を倍々精度演算で実装した。【課題１：インテル新アーキテクチャでの４倍精度演算の実装と高速化】に対しては、数値計算ライブラリLisをベースに、倍々精度演算機能をインテル社アーキテクチャAVX2向けに改良し、新たな数値計算ライブラリを構築し、β版として公開した。【課題２：通信量削減方式の実装と高速化】に対しては、SMP型計算機に向け、キャッシュのr利用効率を上げることにより、性能を高めたMatrix Power Kernel(疎行列Aに対してAA…*Aの演算を高速に行う）を実装し、その効果を実証した。また、反復法におけるチェビシェフ多項式を用いた、計算ノード間のデータ通信頻度を削減する方式について研究を進め、その解法の収束挙動が、チェビシェフ多項式を用いない従来の解法に対して、高並列環境でさらに高い並列化効率を得ることができることを確認した。関連発表として、論文「AVX2を用いた倍精度BCRS形式疎行列と倍々精度ベクトル積の高速化」が１件採録となった。また、国際学会（査読有）にて１件、国内学会にて、査読有が１件、査読無が９件の発表を行なった。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由今年度の目標である【計画１】【計画２】を推進した．【計画１】「AVXおよび新Xeon上でのさらなる拡張機能を用いた４倍精度のプロトタイプ作成」については，数値計算ライブラリLisをベースに，AVX2向け４倍精度演算（実装は，倍々精度演算）の実装を行い，新数値計算ライブラリを構築し，β版を公開した．新Xeon向けには，特性評価を実施した．【計画２】「通信量削減を目的とする新しいアルゴリズムの開発・実装」については，SMP型計算機に向け、キャッシュの効率を上げることにより、性能を高めたMatrix Power Kernel(疎行列Aに対してAA…*Aの演算を高速に行う）を実装し、その効果を実証した。また、反復法におけるチェビシェフ多項式を用いた、計算ノード間のデータ通信頻度を削減する方式について研究を進め、その解法の収束挙動が、チェビシェフ多項式を用いない従来の解法に対して、高並列環境でさらに高い並列化効率を得ることができることをスーパコンピュータ京を用いて確認した。
今後の研究の推進方策	【課題１：インテル新アーキテクチャでの４倍精度演算の実装と高速化】に対しては、開発したAVX2対応の数値計算ライブラリを公開し、いろいろな応用に適用し、フィードバックを受け、改善に努める（２７年度）。【課題２：通信量削減方式の実装と高速化】に対しては、反復法におけるチェビシェフ多項式を用いた、計算ノード間のデータ通信頻度を削減する方式に、Matrix Power Kernelの技法を組み込む（２７年度）。さらに、【課題３：自動チューニング技術の適用」】に向けて、課題１の特性評価をもとに、倍精度演算と倍々精度演算から成る実行時自動チューニング機構の組み込むを行なっていく（２７、２８年度）。
次年度使用額が生じた理由	次世代AVX2およびメニーコアのプロセッサが来年以降に市場に出るので、現在は、手持ちのAVX2およびメニーコアのプロセッサを用いて、アルゴリズム、ライブラリの開発を先に進める。
次年度使用額の使用計画	本年度は、アルゴリズムの開発を進め、その成果を海外を含む学会などで公開する。そのための費用として用いる。また、新AVXあるいはメニーコア・プロセッサの購入については、新製品の状況（スペック、現システムとの差分）およびHPC関連の大型計算センタの導入状況も鑑みて、研究計画推進に沿った成果を出すことを目標に実施する。

研究成果
(12件)

すべて 2015 2014

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (11件)

[雑誌論文] AVX2を用いた倍精度BCRS形式疎行列と倍々精度ベクトル積の高速化2014
- 著者名/発表者名
  菱沼利彰, 藤井昭宏, 田中輝雄, 長谷川秀彦
- 雑誌名
  
  情報処理学会論文誌コンピューティングシステム(ACS)
  
  巻: 7 ページ: 25-33
- 査読あり
[学会発表] 共有メモリ環境におけるMatrix Powers Kernelの評価2015
- 著者名/発表者名
  黒田勝汰, 藤井昭宏, 田中輝雄
- 学会等名
  情報処理学会第77回全国大会, No.2J-2
- 発表場所
  京都　京大
- 年月日
  2015-03-17 – 2015-03-19
[学会発表] ハイブリッド並列によるChebychev基底共役勾配法の性能評価2015
- 著者名/発表者名
  野村直也, 熊谷洋佑, 藤井昭宏
- 学会等名
  情報処理学会第77回全国大会, No.2J-1
- 発表場所
  京都　京大
- 年月日
  2015-03-17 – 2015-03-19
[学会発表] Xevolverを用いたGMPコードへの自動変換機能の実装2015
- 著者名/発表者名
  丸地賢, 佐々木信一, 菱沼利彰, 藤井昭宏, 田中輝雄, 平澤将一
- 学会等名
  情報処理学会第77回全国大会, No.J-4
- 発表場所
  京都　京大
- 年月日
  2015-03-17 – 2015-03-19
[学会発表] Matrix Powers Kernel の共有メモリ環境への適用におけるMulticolor ordering による重複計算の軽減2015
- 著者名/発表者名
  黒田勝汰, 藤井昭宏, 田中輝雄
- 学会等名
  情報処理学会ハイパフォーマンスコンピューティング研究発表会, Vol.2015-HPC-148
- 発表場所
  別府
- 年月日
  2015-03-02 – 2015-03-03
[学会発表] AVX2を用いた倍々精度反復解法の高速化2015
- 著者名/発表者名
  菱沼利彰, 藤井昭宏, 田中輝雄, 長谷川秀彦
- 学会等名
  情報処理学会ハイパフォーマンスコンピューティング研究発表会, Vol.2015-HPC-148
- 発表場所
  別府
- 年月日
  2015-03-02 – 2015-03-03
[学会発表] スーパコンピュータ京における倍々精度演算の高速化2015
- 著者名/発表者名
  佐々木信一, 藤井昭宏, 田中輝雄, 椋木大地, 今村俊幸
- 学会等名
  Annual Meeting on Advanced Computing System and Infrastructure (ACSI2015)
- 発表場所
  筑波
- 年月日
  2015-01-27 – 2015-01-28
[学会発表] 平方根の任意多倍長計算法の例2015
- 著者名/発表者名
  堀田涼, 田中輝雄, 牧野潔夫
- 学会等名
  日本数式処理学会東北地区合同分科会
- 発表場所
  仙台　東北大
- 年月日
  2015-01-24 – 2015-01-24
[学会発表] 平方根の任意多倍長計算法の例2014
- 著者名/発表者名
  堀田涼, 田中輝雄, 牧野潔夫
- 学会等名
  RIMS共同研究「数式処理研究の新たな発展
- 発表場所
  京都　京大
- 年月日
  2014-08-20 – 2014-08-20
[学会発表] Many Integrated Core architecture における倍々精度疎行列ベクトル積2014
- 著者名/発表者名
  佐々木信一, 菱沼利彰, 藤井昭宏, 田中輝雄
- 学会等名
  SWoPP2014, 情報処理学会ハイパフォーマンスコンピューティング研究会研究報告, vol.2014-HPC-145
- 発表場所
  新潟
- 年月日
  2014-07-29 – 2014-07-30
[学会発表] 超高並列環境での通信削減を目的としたChebyshev基底共役勾配法の特性評価2014
- 著者名/発表者名
  熊谷洋佑, 藤井昭宏, 田中輝雄, 須田礼仁
- 学会等名
  SWoPP2014, 情報処理学会ハイパフォーマンスコンピューティング研究会研究報告, Vol.2014-HPC-145
- 発表場所
  新潟
- 年月日
  2014-07-29 – 2014-07-30
[学会発表] Fast computation of double precision sparse matrix in BCRS and DD vector product using AVX22014
- 著者名/発表者名
  Toshiaki Hishinuma, Akihiro Fujii, Teruo Tanaka, and Hidehiko Hasegawa
- 学会等名
  11th International Meeting HighPerformance Computing for Computional Science (VECPAR2014)
- 発表場所
  Eugene,Oregon, USA
- 年月日
  2014-07-01 – 2014-07-03

2014 年度 実施状況報告書

ベクトル演算と通信量削減によるマルチコア向け４倍精度反復法アルゴリズムの開発

研究代表者

田中 輝雄 工学院大学, 情報工学部, 教授 (90622837)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] AVX2を用いた倍精度BCRS形式疎行列と倍々精度ベクトル積の高速化2014

著者名/発表者名

雑誌名

[学会発表] 共有メモリ環境におけるMatrix Powers Kernelの評価2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] ハイブリッド並列によるChebychev基底共役勾配法の性能評価2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Xevolverを用いたGMPコードへの自動変換機能の実装2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Matrix Powers Kernel の共有メモリ環境への適用におけるMulticolor ordering による重複計算の軽減2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] AVX2を用いた倍々精度反復解法の高速化2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] スーパコンピュータ京における倍々精度演算の高速化2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 平方根の任意多倍長計算法の例2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 平方根の任意多倍長計算法の例2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Many Integrated Core architecture における倍々精度疎行列ベクトル積2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 超高並列環境での通信削減を目的としたChebyshev基底共役勾配法の特性評価2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Fast computation of double precision sparse matrix in BCRS and DD vector product using AVX22014

著者名/発表者名

学会等名

発表場所

年月日

2014 年度実施状況報告書

田中輝雄工学院大学, 情報工学部, 教授 (90622837)