2014 Fiscal Year Annual Research Report
ランダムショートカットと光通信技術による超低遅延グリーンインターコネクト
Project/Area Number |
25280018
|
Research Institution | National Institute of Informatics |
Principal Investigator |
鯉渕 道紘 国立情報学研究所, アーキテクチャ科学研究系, 准教授 (40413926)
|
Co-Investigator(Kenkyū-buntansha) |
石井 紀代 産業技術総合研究所, 電子光技術研究部門, 研究員 (90612177)
天野 英晴 慶應義塾大学, 理工学部, 教授 (60175932)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | ハイパフォーマンス・コンピューティング / フォトニックネットワーク / 計算機システム / 相互結合網 |
Outline of Annual Research Achievements |
本研究は,エクサスケール規模以上の高性能計算機システムにおいて,ランダムショートカットリンク接続を光波長多重スイッチ技術により実現することで(1)最長通信遅延1μ秒,(2)現状の電気スイッチのみを用いたHPCインターコネクトと比べて電力性能比10倍(3)通信パターンに応じた可変トポロジを実現するインターコネクトを探求することを目的としている.平成26年度は、まず、電気スイッチネットワークに対し,光波長多重スイッチを補助的に利用することにより,k-ary n-cube, Fat ツリー,ランダムという3種類の電気スイッチ間トポロジを効率良く内包可能な低遅延結合網を提案した.提案手法は,既存のトポロジに比べ低い導入コストで,かつ,遺伝的アルゴリズムによる探索範囲を限定することでトポロジ内包性とシステム全体での低遅延性を両立できることが分かった.そして多くの場合,並列アプリケーションのプロセス空間に適したトポロジを全体の計算システムから割り当てることが可能となることが分かった.次に、本相互結合網を導入する場合のフロアプランについて,拡張可能なように光パッチパネルを導入する方法、低遅延低次元トポロジの提案とそのトポロジにおける任意の電気、光波長多重スイッチ数の拡張が可能なフロアプランを開発した.そして,最終的に本相互結合網における数千並列で実行する並列科学技術アプリケーションの評価を行うことが可能なイベントドリブンシミュレーションSimGrid 環境の構築を行い、通信プロファイルのさらなる見える化を実現する拡張を行った.以上より,光波長多重スイッチと電気スイッチの混在する相互結合網における(電気スイッチの)可変トポロジの構築方法を確立し、並列アプリケーションの通信パターンに合わせた構成が可能となり、数百ラック規模の計算機システムにおいて最長ゼロ負荷通信遅延1μ秒を達成できる場合が多いことが分かった.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
平成26年度は、MPI並列プログラムの実行時間を数% の誤差で見積ることができるイベントドリブンシミュレーション SimGrid を用いた評価環境を構築することができ、提案可変トポロジの有効性を示す評価を行うことができた。これは、SimGrid研究開発チーム(フランス)からの直接的なバグフィックスを含むサポートが想定外に得られたことによる。その結果,目的の1つである通信パターンに応じた可変トポロジの実現を示すことができた。また、スーパーコンピュータのネットワーク機器の遅延、コスト、電力計算などに関する計算ツールを開発することで,一部実機による測定を行わずとも、システム設計の評価を行うことができた。このことにより、もう1つの目的である最長通信遅延1μ秒について、多くの場合達成できることを示した. 以上より、本研究の課題について現時点で一部解決しており,当初の計画以上に進展しているといえる。
|
Strategy for Future Research Activity |
当初の計画以上に進展しているため、現状の研究体制,総括の枠組みを維持する。 これまでに構築した可変トポロジにおけるショートカットリンク構築に関して、光多重による更なる効率的な構成方法を開発する。これは相互結合網のスケーラビリティとコスト抑制を行うためには必須である。この構成方法に基づく設計を進めることで、直接網、間接網を問わず現状最大規模以上のスーパーコンピュータの相互結合網を構築可能とする。さらに、ツリー系トポロジを採用しているデータセンターへの適用を実現する。本可変相互結合網の構成方法の戦略により、エクサスケール規模以上の計算機において最長通信遅延1μ秒、現状のInfiniBandの電気スイッチのみで構成した場合と比べて電力性能比10倍を達成する。なお、今後も2ヶ月に一度程度、研究代表者、研究分担者、ほぼすべての連携研究者が参加する合同ミーティングを開催し、各研究機関が開発しているツールの共有統合を含めた進捗管理を行う予定である.
|
Causes of Carryover |
SimGridシミュレーションによる評価環境の構築が当初の予定よりも早く進んだため,国立情報学研究所アーキテクチャ科学研究系特任研究員1名の本研究に関する雇用期間を若干短縮することができた.そのため次年度使用金額が生じた.
|
Expenditure Plan for Carryover Budget |
当初の計画よりも多くの成果が生じているため,今後それらの発表に関してスーパーコンピュータ,並列分散システムおよび計算機アーキテクチャに関する国際会議への参加が必要となる.そのための旅費,参加費に使用する予定である.
|
-
-
-
-
-
[Journal Article] Layout-aware Expandable Low-degree Topology2014
Author(s)
Nguyen T. Truong, Van K. Nguyen, Nhat T. X. Le, Ikki Fujiwara, Fabian Chaix and Michihiro Koibuchi
-
Journal Title
The 20th IEEE International Conference on Parallel and Distributed Systems (ICPADS)
Volume: 1
Pages: 462,470
DOI
Peer Reviewed / Acknowledgement Compliant
-
-
-
-
-
[Presentation] Layout-aware Expandable Low-degree Topology2014
Author(s)
Nguyen T. Truong, Van K. Nguyen, Nhat T. X. Le, Ikki Fujiwara, Fabian Chaix and Michihiro Koibuchi
Organizer
The 20th IEEE International Conference on Parallel and Distributed Systems (ICPADS)
Place of Presentation
Hsinchu, Taiwan
Year and Date
2014-12-16 – 2014-12-19
-
-
-