2021 Fiscal Year Research-status Report

広帯域光通信によるFPGA主導型相互結合網

Research Project

Project/Area Number	21K11859
Research Institution	National Institute of Informatics
Principal Investigator	胡曜国立情報学研究所, アーキテクチャ科学研究系, 特任研究員 (50791232)
Project Period (FY)	2021-04-01 – 2024-03-31
Keywords	大規模計算機システム / 光通信ネットワーク / FPGA結合網 / タスクスケジューリング
Outline of Annual Research Achievements	各アプリケーションの実行に必要な種類と数のハードウェアを確保し、そのアプリケーション通信の論理トポロジに基づいて、時分割多重(TDM)サーキットスイッチ光通信を用いて最適な物理トポロジを構築する方式を探求した。この方式により異種ハードウェアが割り当てられている間はそのアプリケーションが占有する形をとることにより、確実に性能をアプリケーションに対して割り当てる。そこで、様々な並列アプリケーションを1つのデータセンターで低遅延かつ効率的にサポートすることが期待できる。具体的に、パケット競合が起きないように従来データセンターのパケットスイッチと異なるTDMサーキットスイッチ方式を採用することにより、通信帯域や遅延を保証することができる。そして、入力した通信パターンに合わせた最適なFPGA主導型の光通信トポロジの動的構成法を提案し、ポストムーアにも対応できるデータセンターシステムの設計法を検討した。これにより、計算機システム大規模化に伴うデータセンター全体の電力消費量や通信量がある計算ノード間のホップ数(通信遅延)を削減することが可能である。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 最初予定通りに研究を遂行している。ハードウェア的アプローチとして、光通信モジュール実装上の制約を考慮に入れ、ホストプロセッサの介在なしに異種ハードウェア間を直接接続することによりオーバヘッドの小さな並列処理を可能とする相互結合網を導き出した。また、各ハードウェア間をつなぐインタフェースを規定するとともに、接続を動的に変更するのに適したネットワークを設計開発した。その手段として、現在最先端のインテルFPGAデータセンターシステムの概念をさらに拡張し、低通信遅延FPGAファブリックに新たなNICを追加することで共有メモリとRDMA(Remote Direct Memory Access)の両方を使用できる時分割多重(TDM)サーキットスイッチ方式で接続する光通信ネットワークを提案した。この方式により、並列アプリケーションのホップ数や通信遅延が短縮されることが可能となった。今後、異なるハードウェアを直接結合し通信やスケジューリングのオーバヘッドを削減したうえで、広帯域光通信技術を用いた異種ハードウェア混在環境のデータセンターにおける低遅延かつ高効率な処理を探求する予定である。
Strategy for Future Research Activity	ソフトウェア的アプローチとして、タイムスロットの割り当ての衝突回避を考慮し、入力した通信パターンに合わせた最適な光通信トポロジの動的構成法を開発する。その手段として、Pythonで実装したスパコンネットワーク生成シミュレータとNetworkX/Pandas/C++で実装したトポロジ解析ツール群をすでに保有しており、10万ノード程度までのネットワーク生成・グラフ解析が可能となっている。本研究が進むにつれ、ツールを随時拡張しながら活用する予定である。しかし、ターゲットとする100万ノードくらいの規模では非現実的な実行時間を要するため、アルゴリズムの改善や計算能力の増強、並びにMATLAB、Mathematicaといった有償ソフトウェアの利用も検討する必要があるという結論に至った。これにより、真の資源利用率向上やシステム全体のスケーラビリティ最大化をもたらす新たな異種ハードウェア間光通信相互結合網の設計を明らかにする。また、本研究が進むにつれ、ツールを随時拡張しながら活用する予定である。計算能力が不足すれば、より多くの仮想計算機を利用できる高性能計算クラウドサービスにより大きな仮想計算機を構築して提案システムの効率を評価する。なお、研究過程で得られた知見については、研究会・国際会議・論文誌などで随時発表し、産業界・学術界の技術者・研究者らと幅広い議論を交えながら研究を進める。
Causes of Carryover	本研究では、100万ノードくらいの大規模計算機システムを対象としたトポロジ構成・グラフ解析およびイベント・ドリブン型スケジュールシミュレーションを計画している。これを現実的な時間内で実行するために、高いCPU演算能力と大容量メモリを持つメニーコア計算機、高性能計算クラウドサービスと有償数理解析ソフトウェアの併用が必要不可欠である。購入したすべての機器類は国立情報学研究所に設置し、設備を集約することで費用対効果の最大化を図る。また、大量のシミュレーションデータの集計作業を含む技術補佐のために短時間の謝金を計上している。研究補佐要員への謝金予算は、国立情報学研究所の規定による研究補助の謝金算定基準をもとに算出した。計算機アーキテクチャや並列分散システムをはじめとする幅広い分野の論文誌・国際会議・学会で研究成果を発表するための学術論文掲載料(論文別冊を含む)、会議・学会登録料、旅費なども必要である。旅費は、最低の交通費(エコノミー)、国立情報学研究所規定の宿泊費・日当をもとに算出した。航空運賃に関しては、調達方法によって廉価なチケットを入手することが可能なので、価格が高くない時期に早めに日程を確定し購入することで、予算の節約に細心の注意を払う。なお、収集した資料のうち公開可能なものや研究成果については公開するための印刷費が必要である。報告書も同様である。

Research Products
(1 results)

All Presentation (1 results) (of which Int'l Joint Research: 1 results)

[Presentation] MiniCAR: Minimal Congestion-Aware Routing Method in Fine-Grained Circuit-Switched Networks for Parallel Computing Systems2021
- Author(s)
  Yao Hu
- Organizer
  26th IEEE Symposium on Computers and Communications (ISCC 2021)
- Int'l Joint Research