大規模疎行列処理のためのインストレージアクセラレータの創出

研究課題

研究課題/領域番号	21K17720
研究種目	若手研究
配分区分	基金
審査区分	小区分60040:計算機システム関連
研究機関	東京工業大学
研究代表者	CHU ThiemVan 東京工業大学, 科学技術創成研究院, 助教 (80838235)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円) 2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	疎行列処理 / 疎行列疎行列積 / データフロー / アーキテクチャ / FPGA / SpMSpM / アクセラレータアクセラレータ / アクセラレータ / FPGAプロトタイピング / インストレージコンピューティング
研究開始時の研究の概要	本研究では，ビッグデータや機械学習等の多くアプリケーションで求められている大規模疎行列処理を高速化するためのアクセラレータアーキテクチャの確立を目指す．アクセラレータをストレージ内のカスタムハードウェアで実現するアプローチを用いる．ストレージチップ内のデータを低レーテンシかつ高バンド幅でアクセスできるというストレージ内処理の最大の利点を活用するのと，実際の多くのアプリケーションで同時に求められている疎行列・ベクトル積，疎行列積，疎行列転置という3つの主要な疎行列処理のいずれもサポートできるマージソータ，ネットワーク・オン・チップベースのヘテロジニアスメニーコアアーキテクチャを研究開発する．
研究成果の概要	本研究では，大規模疎行列処理を高速かつ高効率に行うためのインストレージアクセラレータアーキテクチャを含む包括的な疎行列処理アーキテクチャの開発を目指している．その第一ステップとして，疎行列と疎行列の積という基本演算に焦点を当て，高速かつ高効率なアーキテクチャの研究を進め，FPGA（Field-Programmable Gate Array）によるハードウェアプロトタイプの実装および評価を行った．主な成果として，VLSI（Very-Large-Scale Integration）とシステム分野の国際会議ASP-DAC 2024での論文発表，3件の招待講演，および2件の受賞が挙げられる．
研究成果の学術的意義や社会的意義	本研究の成果は，疎行列処理の高速化と高効率化を実現することで，ビッグデータ解析，機械学習，科学計算の複雑なシミュレーションなど多くのアプリケーションにおいて重要な計算カーネルの性能向上および計算資源の節約に寄与する．本研究によって提案された手法は，学術的にはアーキテクチャおよびハードウェア設計に新たな知見を提供し，社会的にはデータ分析や人工知能などの発展に大きな影響を与えると期待できる．

報告書

(4件)

研究成果
(6件)

すべて 2024 2022 2021

すべて雑誌論文 (3件) (うち国際共著 1件、査読あり 3件) 学会発表 (3件) (うち国際学会 1件、招待講演 1件)

[雑誌論文] Sparse-Sparse Matrix Multiplication Accelerator on FPGA featuring Distribute-Merge Product Dataflow2024
- 著者名/発表者名
  Yuta Nagahara, Jiale Yan, Kazushi Kawamura, Masato Motomura, Thiem Van Chu
- 雑誌名
  
  Asia and South Pacific Design Automation Conference (ASP-DAC)
  
  巻: 1 ページ: 785-791
- DOI
  10.1109/asp-dac58780.2024.10473865
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Efficient COO to CSR Conversion for Accelerating Sparse Matrix Processing on FPGA2024
- 著者名/発表者名
  Yuta Nagahara, Jiale Yan, Kazushi Kawamura, Masato Motomura, Thiem Van Chu
- 雑誌名
  
  International Conference on Consumer Electronics (ICCE)
  
  巻: 1 ページ: 1-2
- DOI
  10.1109/icce59016.2024.10444348
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Efficient Deadlock Avoidance for 2-D Mesh NoCs That Use OQ or VOQ Routers2024
- 著者名/発表者名
  Philippos Papaphilippou, Thiem Van Chu
- 雑誌名
  
  IEEE Transactions on Computers
  
  巻: 73 号: 5 ページ: 1414-1426
- DOI
  10.1109/tc.2024.3365954
- 関連する報告書
  2023 実績報告書
- 査読あり / 国際共著
[学会発表] ［記念講演］分散マージ乗算手法に基づく疎行列疎行列積アクセラレータ2024
- 著者名/発表者名
  永原雄大，Jiale Yan，川村一志，本村真人，Thiem Van Chu
- 学会等名
  VLSI設計技術研究会（VLD）
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] 外部メモリアクセス抑制による高効率疎行列積アクセラレータの研究2022
- 著者名/発表者名
  永原雄大，安藤洸太，川村一志，劉載勲，本村真人，Thiem Van Chu
- 学会等名
  電子情報通信学会技術研究報告CPSY2022-11, vol. 122, no. 133, pp. 59-64
- 関連する報告書
  2022 実施状況報告書
[学会発表] A High-Performance and Flexible FPGA Inference Accelerator for Decision Forests Based on Prior Feature Space Partitioning2021
- 著者名/発表者名
  Thiem Van Chu, Ryuichi Kitajima, Kazushi Kawamura, Jaehoon Yu, Masato Motomura
- 学会等名
  International Conference on Field-Programmable Technology (ICFPT)
- 関連する報告書
  2021 実施状況報告書
- 国際学会

大規模疎行列処理のためのインストレージアクセラレータの創出

研究代表者

CHU ThiemVan 東京工業大学, 科学技術創成研究院, 助教 (80838235)

4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)

報告書

研究成果

[雑誌論文] Sparse-Sparse Matrix Multiplication Accelerator on FPGA featuring Distribute-Merge Product Dataflow2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Efficient COO to CSR Conversion for Accelerating Sparse Matrix Processing on FPGA2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Efficient Deadlock Avoidance for 2-D Mesh NoCs That Use OQ or VOQ Routers2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] ［記念講演］分散マージ乗算手法に基づく疎行列疎行列積アクセラレータ2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 外部メモリアクセス抑制による高効率疎行列積アクセラレータの研究2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] A High-Performance and Flexible FPGA Inference Accelerator for Decision Forests Based on Prior Feature Space Partitioning2021

著者名/発表者名

学会等名

関連する報告書