• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Interconnection Networks accelerating Large-Scale Distributed Deep Learning with In-Network Computing

Research Project

Project/Area Number 20K19788
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 60060:Information network-related
Research InstitutionNational Institute of Informatics (2021-2023)
Japan Advanced Institute of Science and Technology (2020)

Principal Investigator

Kawano Ryuta  国立情報学研究所, アーキテクチャ科学研究系, 特任助教 (90855751)

Project Period (FY) 2020-04-01 – 2024-03-31
Project Status Completed (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Keywords相互結合網 / 大規模分散深層学習 / ビッグデータ / In-Network Computing / データセンタ
Outline of Research at the Start

大規模AIの実用化に向け、深層学習のビッグデータへの適用が喫緊の課題となっている。その解決策として、データセンタ内にドメイン特化型アーキテクチャと呼ばれる演算機構を分散配置し、学習を行うシステムが有望とされているが、従来のデータセンタ向けネットワークでは、遅延などの通信性能の制約により、大規模分散深層学習の高速化が困難である。
本研究では、ネットワーク上で演算の中間処理を行うIn-Network Computingに着目し、低遅延・低頻度の通信と、従来のネットワーク同様の高帯域性・拡張性を両立可能な、Indirect Random Topologyに基づくスイッチ間ネットワークを実装する。

Outline of Final Research Achievements

Toward practical application of large-scale AI, applying deep learning to big data is an urgent issue. As a solution, a system in which computing mechanisms called domain-specific architectures are distributed within data centers is considered to be promising. Conventional data center networks make it difficult to speed up large-scale distributed deep learning due to communication performance constraints such as packet latency.
In this research, In-Network Computing, which performs intermediate processing of calculations on the network, is focused on. various issues are solved in this research, toward the practical application of an inter-switch network that can achieve both low latency and low frequency communication and the same high bandwidth and scalability as conventional networks.

Academic Significance and Societal Importance of the Research Achievements

本研究で提案する相互結合システムでは、高性能計算システム向けに培われた超低遅延ネットワーク技術の1つであるRandom Topologyをデータセンタ向けに取り入れることにより、近年普及の進むIn-Network Computing技術に対し最適化した。すなわち、スイッチ間ネットワークとそれに基づく分散深層学習向けマッピングアルゴリズムにTreeベースの物理・論理トポロジを用いるという従来のシステム設計論を覆し、従来システムと同等以上の高帯域・高拡張性を保証し、既存システムとの親和性を図った。
こうした研究成果をOSSとして公開し、提案システムの実用化を推進し、社会需要に応えた。

Report

(5 results)
  • 2023 Annual Research Report   Final Research Report ( PDF )
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (10 results)

All 2022 2021 2020

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (9 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] Traffic-Independent Multi-Path Routing for High-Throughput Data Center Networks2020

    • Author(s)
      KAWANO Ryuta、YASUDO Ryota、MATSUTANI Hiroki、KOIBUCHI Michihiro、AMANO Hideharu
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E103.D Issue: 12 Pages: 2471-2479

    • DOI

      10.1587/transinf.2020PAP0005

    • NAID

      130007948560

    • ISSN
      0916-8532, 1745-1361
    • Year and Date
      2020-12-01
    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Dynamic Routing Reconfiguration for Low-Latency and Deadlock-Free Interconnection Networks2022

    • Author(s)
      Ryuta Kawano
    • Organizer
      10th International Symposium on Computing and Networking (CANDAR'22)
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] 画像認識のための Optimally Wired Neural Networks2022

    • Author(s)
      河野 隆太
    • Organizer
      第21回情報科学技術フォーラム (FIT 2022)
    • Related Report
      2022 Research-status Report
  • [Presentation] 経路多様性に着目したニューラルネットワークの配線最適化2022

    • Author(s)
      河野 隆太
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Research-status Report
  • [Presentation] 低直径ネットワーク・トポロジのための適応型デッドロックフリー・ルーティング2022

    • Author(s)
      河野 隆太
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2021 Research-status Report
  • [Presentation] GPU Parallelization of All-Pairs-Shortest-Path Algorithm in Low-Degree Unweighted Regular Graph2021

    • Author(s)
      Ryuta Kawano
    • Organizer
      8th ACIS International Virtual Conference on Applied Computing & Information Technology (ACIT 2021)
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research
  • [Presentation] 任意トポロジに対する仮想チャネルを用いない低遅延なデッドロックフリー・ルーティング2021

    • Author(s)
      河野 隆太
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2021 Research-status Report
  • [Presentation] ルーティングの動的再構成によるネットワークのデッドロックフリー性・低遅延性の両立2021

    • Author(s)
      河野 隆太
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2021 Research-status Report
  • [Presentation] キャビネット内通信を考慮した低直径・配置最適な相互結合網の検討2021

    • Author(s)
      河野 隆太
    • Organizer
      電子情報通信学会 コンピュータシステム研究会(CPSY) FPGA 応用および一般
    • Related Report
      2020 Research-status Report
  • [Presentation] Layout-Oriented Low-Diameter Topology for HPC Interconnection Networks2020

    • Author(s)
      Ryuta Kawano
    • Organizer
      8th International Workshop on Computer Systems and Architectures (CSA'20)
    • Related Report
      2020 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2020-04-28   Modified: 2025-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi