プログラマビリティと電力効率を両立するSIMDベース・アクセラレータの研究

Research Project

Project/Area Number	20H04153
Research Category	Grant-in-Aid for Scientific Research (B)
Allocation Type	Single-year Grants
Section	一般
Review Section	Basic Section 60040:Computer system-related
Research Institution	The University of Tokyo
Principal Investigator	塩谷亮太東京大学, 大学院情報理工学系研究科, 准教授 (10619191)
Co-Investigator(Kenkyū-buntansha)	坂井修一東京大学, 大学院情報理工学系研究科, 教授 (50291290) 入江英嗣東京大学, 大学院情報理工学系研究科, 教授 (50422407) 千葉滋東京大学, 大学院情報理工学系研究科, 教授 (80282713) 小泉透名古屋工業大学, 工学(系)研究科(研究院), 助教 (20981525)
Project Period (FY)	2020-04-01 – 2024-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000) Fiscal Year 2023: ¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000) Fiscal Year 2022: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000) Fiscal Year 2021: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000) Fiscal Year 2020: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Keywords	計算機アーキテクチャ / GPU / マイクロアーキテクチャ
Outline of Research at the Start	本研究では，申請者らを含むグループが研究を進めてきた Dualflow アーキテクチャに基づき，GPU のプログラマビリティを保ちながら電力効率の大きな改善を目指す．Dualflow アーキテクチャは制御駆動とデータ駆動の両方の性質を合わせ持つ独自の命令セット・アーキテクチャである．我々は，演算以外のデータ移動に関わる消費電力が GPU 内では非常に大きな割合を占めることに着目した．このデータ移動に関わる消費電力を Dualflow アーキテクチャの持つデータ駆動の性質を利用することによって大きく削減し，シミュレーションによる検証から実際の LSI 試作までを通して，その効果を明らかにする．
Outline of Annual Research Achievements	2021年度までの研究では，NVIDIA の SIMT 型 GPU が持つ命令セットを拡張し，距離指定型オペランド表現（あるいは Dualflow アーキテクチャ）を組み込んだ新たな命令セットを策定して評価検討を行っていた．この評価の結果，命令数がかえって増加してしまい性能が低下してしまう場合が多く見られた．この命令数の増加は，距離指定型オペランド表現では異なる制御フローを辿った場合にも参照距離を一定にするために，追加の命令が必要なためである．これに対し，2022年度には，上記の問題を解決するオペランド参照のハイブリッド方式を発案した．この方式では従来のレジスタ番号によるオペランド参照と提案する距離指定によるオペランド参照を選択して使用することができ，追加の命令が多く必要な場合は従来のレジスタ番号による参照を用いることで命令数の増加を回避する．この方式は out-of-order 実行を基本とする CPU では適用できず，マルチスレッディングと in-order 実行を基本とする GPU においてのみ実現可能であり，GPU において部分的な out-of-order 実行を可能にする．また，このハイブリッド方式に基づく，メモリアクセスの軽量なリオーダリング方式も発案した．このリオーダリング方式では，ハイブリッド方式においてレジスタ番号を使用して結果を書き込む命令がリオーダリングを阻害する事を逆に利用し，それを軽量なバリアとして用いる．これにより，特別な機構の追加く，非常に軽量にメモリリオーダリングの制御が可能になった．
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 上記のハイブリッド方式を実装し初期的な評価を行った．これまでの評価では非常に良好な結果を得ており，従来の提案方式が持つ問題をほぼ完全に解決して命令数をほとんど全く増加させずにコードを生成できるようになった．また，メモリアクセスのリオーダリングについてもこのハイブリッド方式を利用する形で，非常に効果的に実装できた．ただし，このハイブリッド方式は当初想定されていなかった事もあり，コードの生成系やシミュレータを全て実装し直すことになったため，当初の計画よりもそれらのために時間がかかった．
Strategy for Future Research Activity	上記のハイブリッド方式に基づくシミュレータやコード生成系の実装はある程度評価を行えるところまでは進んでいるものの，一部アプリケーションにまだ対応できていない部分がある．このため，不足している機能を補い，それらのアプリケーションへの対応を進める．また，これまでに実施できていない提案するアーキテクチャの回路面積や消費電力を評価するためのシミュレーション基盤やハードウェア実装を整える．

Report

(3 results)

Research Products
(14 results)

All 2023 2022 2021 2020

All Presentation (14 results) (of which Int'l Joint Research: 4 results)

[Presentation] A Sound and Complete Algorithm for Code Generation in Distance-based ISA2023
- Author(s)
  Shu Sugita, Toru Koizumi, Ryota Shioya, Hidetsugu Irie, and Shuichi Sakai
- Organizer
  ACM International Conference on Compiler Construction (CC)
- Related Report
  2022 Annual Research Report
[Presentation] 部分的なインオーダ実行の導入によるベクトル拡張命令の高効率な実装2023
- Author(s)
  木村優之，塩谷亮太
- Organizer
  研究報告システム・アーキテクチャ（ARC）
- Related Report
  2022 Annual Research Report
[Presentation] T-SKID: Predicting When to Prefetch Separately from Address Prediction2022
- Author(s)
  Toru Koizumi, Tomoki Nakamura, Yuya Degawa, Hidetsugu Irie, Shuichi Sakai, and Ryota Shioya
- Organizer
  Design, Automation and Test in Europe Conference and Exhibition (DATE22)
- Related Report
  2022 Annual Research Report
[Presentation] T-SKID: Predicting When to Prefetch Separately from Address Prediction2022
- Author(s)
  Toru Koizumi, Tomoki Nakamura, Yuya Degawa, Hidetsugu Irie, Shuichi Sakai, and Ryota Shioya
- Organizer
  Design, Automation and Test in Europe Conference and Exhibition (DATE)
- Related Report
  2021 Annual Research Report
- Int'l Joint Research
[Presentation] アドレスとタイミングの予測を分離したデータプリフェッチャ2022
- Author(s)
  小泉透, 中村朋生, 出川祐也, 入江英嗣, 坂井修一, 塩谷亮太
- Organizer
  研究報告システム・アーキテクチャ（ARC）
- Related Report
  2021 Annual Research Report
[Presentation] STRAIGHTアーキテクチャにおけるC++コンパイラ開発と性能評価2022
- Author(s)
  灘洋太郎, 小泉透, 杉田脩, 塩谷亮太, 門本淳一郎, 入江英嗣, 坂井修一
- Organizer
  研究報告システム・アーキテクチャ（ARC）
- Related Report
  2021 Annual Research Report
[Presentation] Compiling and Optimizing Real-world Programs for STRAIGHT ISA2021
- Author(s)
  Toru Koizumi, Shu Sugita, Ryota Shioya, Junichiro Kadomoto, Hidetsugu Irie, and Shuichi Sakai
- Organizer
  IEEE International Conference on Computer Design (ICCD 39)
- Related Report
  2021 Annual Research Report
- Int'l Joint Research
[Presentation] Accurate and Fast Performance Modeling of Processors with Decoupled Front-end2021
- Author(s)
  Yuya Degawa, Toru Koizumi, Tomoki Nakamura, Ryota Shioya, Junichiro Kadomoto, Hidetsugu Irie, and Shuichi Sakai
- Organizer
  IEEE International Conference on Computer Design (ICCD 39)
- Related Report
  2021 Annual Research Report
- Int'l Joint Research
[Presentation] STRAIGHTアーキテクチャにおけるスケーラブルなスケジューラの提案と評価2021
- Author(s)
  新浩太朗, 小泉透, 杉田脩, 光野聡志, 門本淳一郎, 塩谷亮太, 入江英嗣, 坂井修一
- Organizer
  研究報告システム・アーキテクチャ（ARC）
- Related Report
  2021 Annual Research Report
[Presentation] Dualflow アーキテクチャの適用による GPU の高電力効率化の検討2021
- Author(s)
  松尾玲央馬, 眞下達, 塩谷亮太
- Organizer
  研究報告システム・アーキテクチャ（ARC）
- Related Report
  2021 Annual Research Report
[Presentation] A High-Performance Out-of-Order Soft Processor Without Register Renaming2020
- Author(s)
  Satoshi Mitsuno, Junichiro Kadomoto, Toru Koizumi, Ryota Shioya, Hidetsugu Irie, and Shuichi Sakai
- Organizer
  IEEE International Conference on Field-Programmable Logic and Applications (FPL)
- Related Report
  2020 Annual Research Report
- Int'l Joint Research
[Presentation] プリフェッチ距離の性質に着目した命令プリフェッチャ2020
- Author(s)
  中村朋生, 小泉透, 出川祐也, 入江英嗣, 坂井修一, 塩谷亮太
- Organizer
  2020年並列／分散／協調処理に関する『福井』サマー・ワークショップ
- Related Report
  2020 Annual Research Report
[Presentation] STRAIGHTにおける実用プログラムの最適化コンパイル手法2020
- Author(s)
  小泉透, 杉田脩, 塩谷亮太, 入江英嗣, 坂井修一
- Organizer
  第234回システム・アーキテクチャ研究発表会
- Related Report
  2020 Annual Research Report
[Presentation] D-JOLT: Distant Jolt Prefetcher2020
- Author(s)
  Tomoki Nakamura, Toru Koizumi, Yuya Degawa, Hidetsugu Irie, Shuichi Sakai, and Ryota Shioya
- Organizer
  The 1st Instruction Prefetching Championship
- Related Report
  2020 Annual Research Report

プログラマビリティと電力効率を両立するSIMDベース・アクセラレータの研究

Principal Investigator

塩谷 亮太 東京大学, 大学院情報理工学系研究科, 准教授 (10619191)

¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)

Current Status of Research Progress

Reason

Report

Research Products

[Presentation] A Sound and Complete Algorithm for Code Generation in Distance-based ISA2023

Author(s)

Organizer

Related Report

[Presentation] 部分的なインオーダ実行の導入による ベクトル拡張命令の高効率な実装2023

Author(s)

Organizer

Related Report

[Presentation] T-SKID: Predicting When to Prefetch Separately from Address Prediction2022

Author(s)

Organizer

Related Report

[Presentation] T-SKID: Predicting When to Prefetch Separately from Address Prediction2022

Author(s)

Organizer

Related Report

[Presentation] アドレスとタイミングの予測を分離したデータプリフェッチャ2022

Author(s)

Organizer

Related Report

[Presentation] STRAIGHTアーキテクチャにおけるC++コンパイラ開発 と性能評価2022

Author(s)

Organizer

Related Report

[Presentation] Compiling and Optimizing Real-world Programs for STRAIGHT ISA2021

Author(s)

Organizer

Related Report

[Presentation] Accurate and Fast Performance Modeling of Processors with Decoupled Front-end2021

Author(s)

Organizer

Related Report

[Presentation] STRAIGHTアーキテクチャにおけるスケーラブルなスケジューラの提案と評価2021

Author(s)

Organizer

Related Report

[Presentation] Dualflow アーキテクチャの適用による GPU の高電力効率化の検討2021

Author(s)

Organizer

Related Report

[Presentation] A High-Performance Out-of-Order Soft Processor Without Register Renaming2020

Author(s)

Organizer

Related Report

[Presentation] プリフェッチ距離の性質に着目した命令プリフェッチャ2020

Author(s)

Organizer

Related Report

[Presentation] STRAIGHTにおける実用プログラムの最適化コンパイル手法2020

Author(s)

Organizer

Related Report

[Presentation] D-JOLT: Distant Jolt Prefetcher2020

Author(s)

Organizer

Related Report

塩谷亮太東京大学, 大学院情報理工学系研究科, 准教授 (10619191)

[Presentation] 部分的なインオーダ実行の導入によるベクトル拡張命令の高効率な実装2023

[Presentation] STRAIGHTアーキテクチャにおけるC++コンパイラ開発と性能評価2022