研究課題
並列実行可能なタスクを多く含むアプリケーションを異種複数のプロセッサを利用可能なシステムで実行する場合、それらのタスクを各プロセッサへと適材適所を考慮しながら割当てる必要がある。そのようなタスク割当てを実行時性能予測に基づいて自動化する研究を行い、複数のプロセッサをOpenCLプログラム内では仮想的に一つに見せる技術を提案した。その有効性を定量的に評価した結果、タスク割当を自動化することによって、システムに依存したコードを書かずに各プロセッサを性能に応じて適切に利用できることが明らかになった。また、OpenCL経由で遠隔のベクトル型スーパーコンピュータを利用する仕組みを構築し、多数かつ多様な計算ノードで構成される大規模複合型計算システム向けのプログラミングの新しい形を提案した。計算ノードあたり1TBのメモリを搭載している大規模ベクトル型システムをあたかも巨大なGPUのように扱うことができるようになり、スパコンとGPUを用途に応じて使い分けができる可能性を示した。高信頼化のために、それまでは困難であったOpenCLアプリケーションのチェックポイントリスタート機能についても実現方法を検討し、少ない実行時オーバヘッドでアプリケーションから透過的にチェックポイントリスタートを実現できることを示した。また、チェックポイントファイルをストレージに書き込む時間が時間的オーバヘッドの大半を占めることから、階層的ストレージシステムの有効利用によってオーバヘッドをさらに削減できることを示した。最終年度には、複合型計算システム向けプログラミング環境として急速に普及したOpenACCも評価対象として考え、その実用性や現時点での制約について明らかにした。また、制約を緩和するための機能拡張方法についても検討した。
すべて 2013 2012 その他
すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (14件) (うち招待講演 7件)
2013年ハイパフォーマンスコンピューティングと計算科学シンポジウム
巻: 113 - 119 ページ: 113 - 119
Multicore and GPU Programming Models, Languages and Compilers
巻: 印刷中 ページ: 印刷中
IEEE Region 10 Conference (TENCON 2012)
巻: - ページ: 1-6
10.1109/TENCON.2012.6412343
Sustained Simulation Performance 2012
巻: 1 ページ: 123-132
10.1007/978-3-642-32454-3_11