プログラマビリティと電力効率を両立するSIMDベース・アクセラレータの研究
Project/Area Number |
20H04153
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 60040:Computer system-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
塩谷 亮太 東京大学, 大学院情報理工学系研究科, 准教授 (10619191)
|
Co-Investigator(Kenkyū-buntansha) |
坂井 修一 東京大学, 大学院情報理工学系研究科, 教授 (50291290)
入江 英嗣 東京大学, 大学院情報理工学系研究科, 教授 (50422407)
千葉 滋 東京大学, 大学院情報理工学系研究科, 教授 (80282713)
小泉 透 名古屋工業大学, 工学(系)研究科(研究院), 助教 (20981525)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2023: ¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2022: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2021: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2020: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
|
Keywords | 計算機アーキテクチャ / GPU / マイクロアーキテクチャ |
Outline of Research at the Start |
本研究では,申請者らを含むグループが研究を進めてきた Dualflow アーキテクチャに基づき,GPU のプログラマビリティを保ちながら電力効率の大きな改善を目指す.Dualflow アーキテクチャは制御駆動とデータ駆動の両方の性質を合わせ持つ独自の命令セット・アーキテクチャである.我々は,演算以外のデータ移動に関わる消費電力が GPU 内では非常に大きな割合を占めることに着目した.このデータ移動に関わる消費電力を Dualflow アーキテクチャの持つデータ駆動の性質を利用することによって大きく削減し,シミュレーションによる検証から実際の LSI 試作までを通して,その効果を明らかにする.
|
Outline of Annual Research Achievements |
2021 年度は以下の2点に関わる研究を行った: 1. 命令セットに関する要素技術の研究:これまで Dualflow アーキテクチャは汎用 CPU をターゲットとして研究が行われてきたため,それとは大きく性質が異なる SIMD ベースの GPU では命令セットの性質(主に命令間の参照距離の性質や,これに基づくバイナリ生成時の効率)が大きく異なる.このため,前年度に引き続き今年度も GPU 向けに Dualflow アーキテクチャを導入するための検討と評価を行った.今年度までの研究により,NVIDIA の GPU が持つ命令セットを拡張して Dualflow アーキテクチャによる距離表限を組み込んだ新たな命令セットの基本的な策定が終わり,ベンチマークプログラムをシミュレータ上で評価し検証を行った. 2. マイクロアーキテクチャに関する要素技術の研究 GPU への Dualflow アーキテクチャの導入にあたって,それを具体的に実現するためのマイクロアーキテクチャを研究した.これまでに GPU シミュレータへの Dualflow 命令の実装を継続して行ってきており,今年度はこのシミュレータを用いてより詳細な検討や評価を行った.これらの実装や評価の過程で,GPU が元から持つスケジューラを活用することで,従来想定していたよりもより少ない変更で GPU に提案手法を実装する方法を発案した. 上記の命令セットやマイクロアーキテクチャに関する要素技術の研究の結果,一部ベンチマークでは大きな性能向上を確かめたものの,Dualflow アーキテクチャによる命令数増加により返って性能が低下してしまう場合があり,この点が次年度以降で解決すべき課題となった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上記の研究を実施するにあたり,これまで GPGPUSim と呼ばれる GPU シミュレータをベースに,Dualflow アーキテクチャを実装してきた.今年度はさらにシミュレータの入力となる命令列を生成するためのコード生成器をシミュレータと並行して実装した.これらの実装はコロナ渦の影響もあり,当初の予定よりも実装が遅れているものの,GPGPU の研究で一般に用いられているベンチマークをある程度実際に検証可能なまで実装が進んでおり,今年度は速度などの評価を実際に行う事ができた.また,このシミュレータやコード生成器の実装を通じ,Dualflow アーキテクチャを導入するための多くの知見を得ることができた.
|
Strategy for Future Research Activity |
現在のコード生成器が生成する命令列は効率が悪く,一部のプログラムにおいて命令数が増加してしまう傾向がある.今後はこの命令数増加を抑えるためのコード生成アルゴリズムや,あるいは命令セットの工夫について研究を行う.また,これまでは命令数や性能のみを評価してきたが,今後は提案するアーキテクチャの消費電力を評価するための基盤を整える.
|
Report
(2 results)
Research Products
(11 results)