本研究の目的は,トロピカル代数系で記述された組合せ最適化問題を,GPU(Graphics Processing Unit)などの計算アクセラレータ上で加速することである.その実現のために,トロピカル代数系に特有の最適化技術を開発し,その計算基盤を最先端の超並列アーキテクチャ上に展開する.また,具体的な応用として,生命情報科学などで頻出する組合せ最適化問題を高速に解くGPU計算手法を開発する.具体的には以下の課題に取り組んだ. まず,上記の応用がトロピカル代数上の行列積で解けることから,通常の行列積における加算演算子および乗算演算子を,それぞれ通常の最大値関数maxおよび加算演算子に置換することで,通常の行列積をトロピカル代数上の行列積に置換した場合の性能を計測した.結果として,トロピカル代数上の行列積においては,通常の行列積と同様に,タイリングなどのキャッシュ最適化技術が高い性能を達成するために有効であることを確認した. 次に,トロピカル代数上の演算子の性質に着目し,計算の一部を省略する最適化技術を開発した.本技術は,行列を構成する要素の値が0である場合,その要素に関連するデータ参照ならびに計算を省き,無限大の値を含む演算に対しては,部分行列(タイル)単位で計算を省く.このトロピカル代数に固有の最適化技術を,計算粒度の細かいレベルから粗いレベルまでGPU上で実現し,最短経路探索問題での効果を確認した. 最後に,CPU・GPU間のデータ転送量を削減することによりGPU応用を高速化することを目的として,GPU上で非可逆データ圧縮・解凍を実現する並列アルゴリズムを開発した.単精度あるいは倍精度の浮動小数点数データに対する圧縮率や精度を評価し,既存の圧縮手法cuZFPに対する優位性を示した.
|