研究課題/領域番号 |
16K16062
|
研究機関 | 東京女子大学 |
研究代表者 |
椋木 大地 東京女子大学, 理学研究科, 研究員 (90742289)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | Reduced-precision / GPU / 浮動小数点 |
研究実績の概要 |
本年度は後述する研究代表者の転属にともなう研究進捗の遅れにより,研究発表に結びつく業績が得られなかった.以下に本年度の研究進捗状況を記す. (1) GPUにおける疎行列ベクトル積カーネルへの適用を引き続き検討した.前年度は広く普及しているCSRフォーマットへの適用を検討したが,行列データへの間接参照に必要となるインデックス行列へのアクセスコストにより短尺形式の効果が十分得られないケースが見られた.そこでインデックス行列の圧縮によりその参照量を大幅に減らした新フォーマットであるAMBフォーマット[Nagasaka et al. 2016]への適用を検討したが,CSR形式の場合と比べて大きな性能改善は得られなかった.現在プロファイラを使用するなどして性能ボトルネックの分析を進めている. (2) 研究代表者が別課題によりこれまで開発してきた,GPU向けの自動チューニング機構付きBLASカーネル群MUBLASへの,短尺形式の適用作業を進めた(作業は現在進行中である).短尺形式のサポートにより演算精度・データ型の異なるカーネル群を大量に実装・性能最適化する必要が生じるため,自動チューニング機能のサポートが不可欠である.MUBLASへの組み込みにより自動チューニングによる短尺形式対応BLASの性能最適化を試みる. (3) GPUにおいて姫野ベンチマーク(非圧縮流体解析コードのベンチマークプログラム)に短尺形式を適用し,短尺形式による速度向上を確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
今年度は本研究計画段階では予定されていなかった研究代表者の転属が10月に発生し,これに起因する前職および現職の本務にかかる予定外の業務が多数生じたため,本研究が計画通り進行できなくなった.このため補助事業期間延長の申請を行ない,了承された.
|
今後の研究の推進方策 |
(1)GPUにおける疎行列ベクトル積および疎行列反復解法への適用を引き続き検討する. (2)MUBLASへのコード統合により自動チューニング付きの短尺形式対応BLASのプロトタイプを実装する. (3)多倍長演算(4倍精度演算)への適用を行う. (4)平成29年度末に購入した電力測定装置を用いて電力性能の詳細な検討を行う. (5)現在執筆中の英文論文を完成させ国際学会へ投稿する.
|
次年度使用額が生じた理由 |
今年度は本研究計画段階では予定されていなかった研究代表者の転属が10月に発生し,これに起因する前職および現職の本務にかかる予定外の業務が多数生じたため,本研究が計画通り進行できなくなった.このため補助事業期間延長の申請を行ない,了承された.次年度繰越分は学会発表のための旅費および英語論文の校正費用に使用する.
|