研究課題
自動チューニングライブラリを構築するためには、最適なパラメーターの値をできるだけ短時間に見つける必要がある。そのためには、パラメーターの値を設定した場合にそのオブジェクトコードが処理を完了するまでの時間をできるだけ正確に見積もる必要がある。そこで、プロセッサーの演算性能や通信性能などの基礎データを測定し、パラメーターの値ごとに実行完了までの時間を見積もるモデルの構築を行った。また、スーパーノードアルゴリズムとマルチフロンタル法に焦点を当て、並列計算機上で実行性能の高い疎行列連立一次方程式の直接解法アルゴリズムの構築を行った。一方、現在のスーパーコンピューターは、数十から数百個のプロセッサーと大容量メモリを搭載するようになったことから、これまで困難とされてきた大規模問題が解けるようになってきた。そこで、自動チューニングライブラリの応用として、超高次元分布関数を用いた流体のメゾスケール解析を行うための、MPIライブラリを用いた効率的な並列計算アルゴリズムを提案した。実際に希薄気体やプラズマ流体解析向けの並列計算コードの構築を行い、日立製作所製スーパーコンピューターSR8000/MPP上でその性能を評価した。実際にテストした問題の中で最大サイズの問題では、1ノード当たり理論ピーク性能1.8GFlopsの35.3%に当たる653MFlopsの性能を達成し、実用時間内で問題を解くことができるようになったことを示した。
すべて 2004
すべて 雑誌論文 (1件)
情報処理学会研究報告 2004-HPC-99 Vol.2004,No.81
ページ: 193-198