Research Abstract |
平成5年度までの研究成果に基づき,最高速度600GFLOPSを目標に超並列計算機のハードウエア及びソフトウエアの開発が行われた。これと共に,物理学計算の仮想ベンチマークテストを行い,計算の基本パラメターの選択に関する検討を行った。また,既存の計算機を用いて,プログラム開発,計算アルゴリズムの改良を行った。 以下に詳細を述べる。 1)実装設計を加味した超並列計算機の詳細設計の確定 ・主記憶の構成と制御方式 主記憶にはDRAM素子を用いた16ウェイのマルチバンク構成を採用することにした.これにより,ノードプロセッサの擬似ベクトル処理機構を最大限活用することができる見込みである. ・キャッシュメモリの制御方式 キャッシュメモリはストアスルー方式を採用する.この方式とすることにより,キャッシュメモリと主記憶との間のデータの無矛盾性維持が容易となる. ・相互結合ネットワークにおける同期方式 同期操作を行う制御線を別に用意することで,データ転送用のネットワークを活用して同期操作を実現する方式を採用することとした. ・相互結合ネットワークにおけるデータ転送方式. 高速通信機構の転送オーバヘッドを極力抑える制御方式を採用した. ・分割運転時の制御方式 分割形態について,分割数と各分割部の大きさを決定した.また,分割運転時のデータ転送と同期操作についての制御方式の検討も行なった. ・並列プロセッサ全体の実装方式 8PU(Processing Unit)を1つの基板に搭載することにより,分散ディスクとコントローラを含め1024PU全体を8筺体程度で実装する方式を採用する方向とした. 2)システムソフトウエアの開発 ・並列ファイル入出力方式 ファイル入出力を並列実行できるように,複数のノードへディスク装置を分散させ,複数のプロセスにより複数のファイルへ同時にアクセスする方式を採用した. 最適化コンパイラのアルゴリズム検討と試作 ノードプロセッサが持つ擬似ベクトル処理機構を最大限活用するための最適化コンパイラのアルゴリズムについて検討した.また,そのコンパイラの雛形の試作を行い,その有効性を確かめた. ・基本ソフトウエアの開発 OSカーネル,言語処理系,ネットワークデータ転送用ライブラリなどの設計仕様がほぼ固まり、一部はパイロットモデル機での部分的実用評価と合わせて,開発進行中である.プログラミング言語として,Fortran77とC言語の使用を予定している.またHPF(High Performance Fortran)についても,HPFからFortran77へのトランスレータを用意する予定である. ・デバッガ及び性能モニタ デバッガ,および性能向上のための指標を与える性能モニタの仕様を検討した. 3)シミュレータの開発と性能評価 ・シミュレータの開発 ノードプロセッサの擬似ベクトル処理機構,キャッシュと主記憶の構成および制御方式をシミュレートするシミュレータを開発した. ・ノードプロセッサの実効性能 シミュレータを用いて量子色力学計算における主要サブルーチンを実行した時の性能を評価した.1ノードプロセッサで実行した時,理論的なピーク性(300MFLOPS)の役65%以上の性能を達成することが確認出来た. ・パイロットモデルの基本性能評価 既に設置稼働しているパイロットモデルの基本性能を評価した.特に,ネットワーク転送のオーバヘッドとスループットに関する基本データを採取し,問題点を整理した. 4)論理設計・実装設計及び部品の試作 ノードプロセッサ及び主記憶系,並列ネットワーク部,システム制御部・入出力部,各々の論理設計及び実装設計を行い,さらに超並列計算機CP-PACSを構成するノードプロセッサ用VLSI,ネットワークボード,入出力系ボード,メモリ系サブユニット部,演算ユニットボード,システム制御ユニット,各々の部品の試作を行った. 5)物理学研究のためのソフトウエア開発 シミュレーターを用いて物理学計算の仮想ベンチマークテストを行い実効性能を評価すると共に,計算の基本パラメターの選択に関する検討を行った. また,既存の計算機を用いて,計算プログラム開発を行い準備計算を遂行した。その結果を基に,プログラムの検討,計算アルゴリズムの改良を行った
|