研究課題/領域番号 |
25330144
|
研究種目 |
基盤研究(C)
|
研究機関 | 工学院大学 |
研究代表者 |
田中 輝雄 工学院大学, 情報工学部, 教授 (90622837)
|
研究分担者 |
長谷川 秀彦 筑波大学, 図書館情報メディア研究科(系), 教授 (20164824)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 4倍精度演算 / 倍々精度演算 / 反復計算ライブラリ / 疎行列計算 / 自動チューニング / マルチコア / ベクトル演算 / AVX |
研究概要 |
収束性の改善と高速性を両立させるため、高精度演算を用いた(疎)行列を対象とした大規模反復計算ライブラリの実現を目指している。その1ステップとして、マルチコア環境での4倍精度演算の実用化を研究している。本研究では、第1に、進化しつつあるIntel社ベクトル機能の特性を明らかにし、そのプロセッサ・アーキテクチャを駆使して、CPU 性能の極限を追求した4倍精度演算処理の実現をはかる。なお,本研究では,4倍精度演算を倍々精度演算で実装する. 課題1「インテル新アーキテクチャでの4倍精度演算の実装と高速化」に対しては,数値計算ライブラリLisの倍々精度演算機構をインテル新アーキテクチャAVX向けに改良した.まずは,共有メモリ型の並列処理環境において,その特性を評価し,倍精度演算と比較して,データ量,演算量の違いにより,キャッシュ容量などの実行環境により,どのように影響されるかを明らかにした.次に,大規模数値計算処理の基本となる倍々精度疎行列-倍精度ベクトル積について分析し,行列形状に対する特性を明らかにし,並列化Open-MPによる自動データ割り付け方式を分析し,新しいデータ割り付け方式を提案した. 課題2「通信量削減方式の実装と高速化」に対しては,反復法におけるチェビシェフ多項式を用いた,計算ノード間のデータ通信頻度を削減する方式について,研究を進め,評価プログラムを開発し,その解法の収束挙動が,チェビシェフ多項式を用いた場合と,同多項式を用いない従来の解法において,ほぼ一致することを確認した. 課題3「自動チューニング技術の適用」我々が自動チューニング用に開発した評価関数d-Splineの特性を利用した,2相問題への適用,線形制約問題への適用について,その有効性を示した. 関連発表として,国際学会(査読有)2件(内,26年度発表確定済1件),国内学会(査読有)1件,(査読無)6件の発表を行なった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度の目標である【計画1】【計画2】を推進した. 【計画1】「AVXおよび新Xeon上でのさらなる拡張機能を用いた4倍精度演算のプロトタイプ作成」については,数値計算ライブラリLisをベースに,AVX向け4倍精度演算(実装は,倍々精度演算)の実装を行い,特性評価を行なった.さらに,新アーキテクチャAVX2についても実装を行い,AVXとのちがいを評価した.その成果は国内外の研究集会にて発表を行なった. 【計画2】「通信量削減を目的とする新しいアルゴリズムの開発・実装」については,反復法におけるチェビシェフ多項式を用いた計算ノード間のデータ通信頻度を削減する方式について,実装を行い,特性評価を行なった.この成果は26年夏の国内研究会にて,発表する計画である.
|
今後の研究の推進方策 |
課題1「インテル新アーキテクチャでの4倍精度演算の実装と高速化」に対しては,今回評価した倍々精度疎行列-倍精度ベクトル積を,様々な大規模反復数値計算処理のアルゴリズムに適用し,倍々精度演算による収束性の改善の可能性を探る(26年度) 課題2「通信量削減方式の実装と高速化」に対しては,チェビシェフ多項式を用いたアルゴリズムを東大等のスーパコンピュータ環境を用いて,さらに高並列環境で実行する(26年度) さらに,課題3「自動チューニング技術の適用」については,課題1での特性評価をもとに,倍精度演算と倍々精度演算利用に対する実行時自動チューニング機構の組み込みを行なっていく(27年度)
|
次年度の研究費の使用計画 |
メニ―コアのプロセッサを購入する予定であったが,新製品が来年度以降に出るので,現在,手持ちのメニーコア・サーバを用いて,アルゴリズムの開発を先に進める. 本年度は,アルゴリズムの開発を進め,その結果を海外を含む学会等に公開する.そのための費用として用いる.また,メニ―コアのプロセッサを購入については,新製品の状況(スペック,現システムとの差)を精査し,研究計画推進に沿った購入計画を実施する.
|