• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

異種アーキテクチャ並列環境におけるスケーラブルな機械学習基盤ソフトウェア技術

研究課題

研究課題/領域番号 20H04165
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分60050:ソフトウェア関連
研究機関東京工業大学

研究代表者

遠藤 敏夫  東京工業大学, 学術国際情報センター, 教授 (80396788)

研究期間 (年度) 2020-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)
2022年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2020年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
キーワード深層学習 / GPU / メモリ階層 / DSL / 並列計算 / マルチコア / 局所性 / 並列処理 / 機械学習 / 異種アーキテクチャ / プログラミング
研究開始時の研究の概要

昨今爆発的に機械学習・深層学習の需要が増し、深層学習フレームワークや対話的処理環境などの普及により、機械学習処理へ様々なプレイヤーが参入する敷居は大きく下がっている。その大規模化・高速化を図るためにはアクセラレータを含む異種プロセッサや多数ノードによる並列化が必要であるが、現状では個別のアルゴリズムごとの対応が必要になり、新規アルゴリズムを提案する場合に大規模化・高速化が滞る傾向にある。そこで本研究では先進プロセッサアーキテクチャや複数ノードによる速度性能と異種メモリによる演算規模を、新規アルゴリズムからも容易に享受できるような、基盤ソフトウェア技術の研究開発を行う。

研究成果の概要

深層学習は多くの計算量を必要とするためにGPUなどの高性能プロセッサを多数必要とする。しかしその高性能を引き出すためには複雑な計算機アーキテクチャの特性を考慮する必要があり、新規学習アルゴリズムの取り入れに障害となる。本研究では高性能とソフトウェア開発コスト低減の両立を対象とした。統合成果の一つとして、多数GPUを持つスパコン上の学習を改善するためのハイブリッド並列学習フレームワークを構築した。

研究成果の学術的意義や社会的意義

LLMの隆盛に代表されるように、機械学習処理には社会を変革する力があると考えられるが、アルゴリズムの改良と大規模な計算機アーキテクチャを活用するための技術の双方が必要である。本研究では主に後者の立場から、GPUなどのプロセッサ内の処理効率化と、多数GPU搭載計算機をよどみなく活用するフレームワーク等を実現した。これら基盤技術により、LLMのさらなる改善への応用が期待される。

報告書

(4件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実績報告書
  • 2020 実績報告書
  • 研究成果

    (9件)

すべて 2023 2022 2021

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (6件)

  • [雑誌論文] Pyramid Swin Transformer: Different-Size Windows Swin Transformer for Image Classification and Object Detection2023

    • 著者名/発表者名
      Wang Chenyu、Endo Toshio、Hirofuchi Takahiro、Ikegami Tsutomu
    • 雑誌名

      Proceedings of the 18th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications

      巻: Vol 5 ページ: 583-590

    • DOI

      10.5220/0011675800003417

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Efficient Stencil Computation with Temporal Blocking by Halide DSL2022

    • 著者名/発表者名
      Aikawa Hiroki、Endo Toshio、Yuki Tomoya、Hirofuchi Takahiro、Ikegami Tsutomu
    • 雑誌名

      proceedings of 20th IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA)

      巻: - ページ: 870-877

    • DOI

      10.1109/ispa-bdcloud-socialcom-sustaincom57177.2022.00116

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Speed-Up Single Shot Detector on GPU with CUDA2022

    • 著者名/発表者名
      Wang Chenyu、Endo Toshio、Hirofuchi Takahiro、Ikegami Tsutomu
    • 雑誌名

      proceedings of 23rd ACIS International Summer Virtual Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing (SNPD2022-Summer)

      巻: - ページ: 89-106

    • DOI

      10.1007/978-3-031-19604-1_7

    • ISBN
      9783031196034, 9783031196041
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [学会発表] 機械学習を用いた音声処理に向けたデータ拡張手法の研究2022

    • 著者名/発表者名
      丸山 翼, 池上 努,遠藤 敏夫,広渕 崇宏
    • 学会等名
      音響・超音波サブソサイエティ合同研究会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 負荷分散を改善したハイブリッドパイプライン並列深層学習手法2022

    • 著者名/発表者名
      細木 隆豊, 遠藤 敏夫,広渕 崇宏,池上 努
    • 学会等名
      並列/分散/協調処理に関するサマーワークショップ(SWoPP2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] タンパク質構造解析システムAlphafoldの実行時ファイルステージングを用いた高速化2022

    • 著者名/発表者名
      大沢 泰生, 遠藤 敏夫, 野村 哲弘
    • 学会等名
      並列/分散/協調処理に関するサマーワークショップ(SWoPP2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] ラムダ式を用いる移植性の高い並列プログラムの実装とCPU・GPU上の評価2022

    • 著者名/発表者名
      瓜生 侑, 遠藤 敏夫
    • 学会等名
      並列/分散/協調処理に関するサマーワークショップ(SWoPP2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 時間ブロッキングを用いたステンシル計算のHalide言語による高性能実装と評価2021

    • 著者名/発表者名
      相川 洋貴,遠藤 敏夫,幸 朋矢,広渕 崇宏
    • 学会等名
      並列/分散/協調処理に関するサマーワークショップ(SWoPP2021)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] GPUクラスタにおけるハイブリッド並列DNN学習のボトルネック分析と改良2021

    • 著者名/発表者名
      細木 隆豊,野村 哲弘,遠藤 敏夫
    • 学会等名
      並列/分散/協調処理に関するサマーワークショップ(SWoPP2021)
    • 関連する報告書
      2021 実績報告書

URL: 

公開日: 2020-04-28   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi