研究概要 |
最新のGPUを搭載した高性能パソコンを導入し,ソフトウェア環境の整備をすると共に,簡単な性能評価を行い従来の高性能GPUとの比較を行った。その結果,最新の機種と開発環境のCUDAでは,処理の高速化のために従来は必要であった細かなチューニングが不要となったことが判明し,本計画での研究開発の方向もより単純化し,算法の並列処理への適合性の検討に重点が置けるようになった。一方,OpenCLをはじめとしたマルチコア向けの汎用的な開発言語・環境の利用も現実味が出てきたため,その方面の検討も今後進める予定である。 算法の検討に関しては,本研究の基礎となる部分に関しまとめと検討を進めている。中でもRNSに関しては過去の研究が多数あり有用性も様々であるため,本計画にどのように取り入れていくかの見極めが難しい。特にRNS表現された整数の符号判定が応用計算の性能に影響するが,効率が良いとされている浮動小数を用いる方法の原理が理解できたので,今後実証実験へと発展させていく。応用では,陰関数描画などのRNS表現を用いた計算については,従来からの実証実験の検証にとどまり,多次元化などの理論的な研究が進展した。特に,その計算法とマルチコア向けの並列処理法を精査し,その多項式関連の計算においてどのようなソフトウェア部品が必要となり,どのように並列処理を行うべきかの検討をすすめた。その他の応用では,暗号計算やファイル圧縮・文字列探索などへのGPU並列処理技術の応用について,これまで進めてきた研究のまとめを行った。
|