研究概要 |
ネットワーク上に分散する計算機資源を仮想的に1つの並列計算機として広域分散メタコンピューティングを行うためには,LAN環境と異なり,データ並列型プログラムを複数の計算機上で並列実行する従来の手法では十分な性能が得られない.そこで,本研究では,処理の手順を分割し複数の並列計算機間でプログラムをパイプライン状に接続することで通信に要する遅延時間の影響を抑えるため,1つの並列計算機上の並列プログラムから遠隔地の並列計算機上で動作する別の並列プログラムに対して高速に並列データ転送を行うための遠隔並列パイプ機構の開発を目指した.15年度までに,異なる並列計算機上で動作する複数のMPIプログラムの間で並列データ転送を行う遠隔並列パイプ機構のプロトタイプを開発した.このような機構はMPI規格には採用されておらず本研究独自の成果である.また,それらの並列計算機間の物理的な通信帯域幅をより有効に利用するため,ネットワークストライピングを採用し,その有効性の検証を行った. 16年度は,15年度に得られたプロトタイプを元に,一般的なPCクラスタ間で利用できる実用的なライブラリを整備した.このような環境下では,IPアドレスの枯渇を防ぐために通信を行うノードが各クラスタ内で1つだけとなることが多いため,データの集約・分散とネットワークストライピングの制御が困難になるが,本ライブラリによりそれを自動化することが可能となった.また,外部通信インタフェースを持たないノードをデータ転送に参加させるためのIPv6利用や,広域分散メタコンピューティングを実現するための認証機構なども合わせて検討した.
|