2016 Fiscal Year Annual Research Report
Runtime autotuning of tile LU factorization for CPU/GPU hybrid environments
Project/Area Number |
26400197
|
Research Institution | University of Yamanashi |
Principal Investigator |
鈴木 智博 山梨大学, 総合研究部, 准教授 (70235977)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | タイルアルゴリズム / タイルサイズチューニング / CPU-GPU実装 / LU分解 / ピボット選択 / ハイパフォーマンスコンピューティング |
Outline of Annual Research Achievements |
はじめに、平成27年度での「ピボット選択、評価」の進捗遅れについての検討を行った。 トーナメント方式によるピボット選択がボトルネックとなってしまうことは判明していたが、結局これを解消することができなかった。そのため、1タイル列のLU分解を、タイル分割せずパネル分解し、後続行列更新をタイル毎に行う手法を導入した。これは、ブロックアルゴリズムの後続行列更新にタイルアルゴリズムを適用することに等しい。さらに、タイル列分解に逐次アルゴリズムよりも高速な再帰アルゴリズムを適用した結果、速度面で有利であるが、精度面で不利な incremental pivoting 付きタイルLU分解よりも高速で高精度な実装が得られた。これは、タイルLU分解と再帰LU分解のハイブリッド版という意味合いのアルゴリズムと言える。 「チューニング機構」については、実行時自動チューニングのための適応的タイルサイズ変更を行う機構を完成させるものであったが、平成27年度に方針変更を行い、予備実験の結果から高速にタイルサイズチューニングを行う手法を導入した。実行時タイルサイズ変更は他のタスクとのオーバーラップで低いコストで実行可能であるが、新しい方針での予備実験は、想定される最も小さいサイズの行列のQR分解1回の実行時間と同等であり、一つの計算環境で一度だけ実行しておけばよい。そのため、実行時に適応的にタイルサイズを変化させる機構を取り入れるよりもコストが安いと判断した。 「性能評価」については、再帰LU分解の分散メモリ環境での実装が年度内に進まず、十分な性能評価を実施することができなかった。 平成28年度は、4件の口頭発表を行い、このうち1件は査読付き国際会議である。
|