本研究では、マルチグレイン並列処理のためのデータローカライゼーション手法、及びデータローカライゼーションによっても除去できなかったプロセッサ間データ転送をプロセッサ上でのタスク処理とオーバラップさせデータ転送オーバーヘッドを隠蔽する技術を開発するとともに、コンパイラにおけるマシンコードスケジューリングの高度化とそれを支援するマルチプロセッサシステムアーキテクチャによりプロセッサ間データ転送順序の最適化も可能とする無同期近細粒度処理技術を開発した。さらにそれらの有効性をアーキテクチャシミュレータ上あるいは実際のスーパーコンピュータ富士通VPP500上で示した。具体的には、データローカライゼーション手法に関する研究では、配列データの自動分割手法(ループ整合分割)とローカルメモリへの割当て法(パ-シャルスタティックスケジューリング)を開発し、OSCARタイプ・アーキテクチャシミュレータ上で有効性を検証した。また、データ転送と処理のオーバーラッピングスケジューリング技術の開発では、Fortranプログラムを解析し富士通VPP500用の並列化拡張言語VPP Fortranを出力するコンパイラ(プリプロセッサ)を開発し、4プロセッサのVPP500上で平均で15%程度実行時間を短縮できることを確めた。 また、無同期近細粒度並列処理技術に関する研究では、高度なマシンコードスケジューリング技術をサポートするアーキテクチャを明確化するとともに、アーキテクチャシミュレータ上で無同期近細粒度並列処理におけるデータ転送順序最適化技術の性能評価を行い手法の有用性を確認した。以上の研究により、今後のベクトルパラレルスーパーコンピュータ、将来のシングルチッププロセッサのアーキテクチャ、及び自動並列化コンパイラに関する指針が得られた。 なお以上の研究成果は、14件の学会論文誌論文あるいは国際会議論文として発表するとともに、1件の学会誌論文として掲載決定、1件の査読付きシンポジウム論文、5件の研究会論文、12件の全国大会論文とした発表されている。
|