本研究課題は,高性能・低消費電力な並列GPUコンピューティングを実現することを目指し,アプリケーションプログラムのGPUでの効率良い並列実行に必要となる最適化手法を明らかすることを試みるものである. 初年度には,GPUのカーネル関数内の条件分岐においてスレッドによって分岐先が異なる場合に分岐先とは反対の実行時時間分の待ちが生じてしまい,これが性能低下と消費電力増加を引き起こしてしまう問題に着目し,ネットワーク侵入検知システム(IDS)におけるパターンマッチング処理のGPUでの実行を具体例とし,パターンマッチングに用いられるAho-Corasik手法のGPUでの処理の問題を解決するための最適化手法を考案した. 二年度目には,並列GPUコンピューティングにおいて並列プログラムの消費電力を考慮した最適化を行うにあたっての個々のGPUの消費電力特性に着眼し,東京大学の多数のGPUを備えた大規模HPCシステムを用いてプログラムの特性測定のための環境構築を進めるとともに,Tesla K40 GPUテストベッドシステムを構築した. 最終年度には,前年度に構築した実行環境において実行時間及び消費電力の測定により最適パラメタの同定とこれを用いたGPUプログラムの最適化方式を検討した.また,前年度導入したGPUテストベッドシステムとは異なるTITAN V GPUを搭載したGPUテストベッドシステムを構築し,その上で必要となるソフトウエアの導入などの環境整備を行った.その結果,複数GPUにおける消費電力を考慮した最適化においては,個々のGPUの消費電力特性を基に最適化を行うことが必要であることを明らかにした. 以上の成果は,並列GPUコンピューティングにおけるアプリケーションプログラムの最適化における重要事項を明らかにした点において意義がある.
|