研究課題/領域番号 |
20H04153
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60040:計算機システム関連
|
研究機関 | 東京大学 |
研究代表者 |
塩谷 亮太 東京大学, 大学院情報理工学系研究科, 准教授 (10619191)
|
研究分担者 |
坂井 修一 東京大学, 大学院情報理工学系研究科, 教授 (50291290)
入江 英嗣 東京大学, 大学院情報理工学系研究科, 教授 (50422407)
千葉 滋 東京大学, 大学院情報理工学系研究科, 教授 (80282713)
小泉 透 名古屋工業大学, 工学(系)研究科(研究院), 助教 (20981525)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2022年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2020年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
|
キーワード | 計算機アーキテクチャ / GPU / マイクロアーキテクチャ |
研究開始時の研究の概要 |
本研究では,申請者らを含むグループが研究を進めてきた Dualflow アーキテクチャに基づき,GPU のプログラマビリティを保ちながら電力効率の大きな改善を目指す.Dualflow アーキテクチャは制御駆動とデータ駆動の両方の性質を合わせ持つ独自の命令セット・アーキテクチャである.我々は,演算以外のデータ移動に関わる消費電力が GPU 内では非常に大きな割合を占めることに着目した.このデータ移動に関わる消費電力を Dualflow アーキテクチャの持つデータ駆動の性質を利用することによって大きく削減し,シミュレーションによる検証から実際の LSI 試作までを通して,その効果を明らかにする.
|
研究実績の概要 |
2021 年度は以下の2点に関わる研究を行った: 1. 命令セットに関する要素技術の研究:これまで Dualflow アーキテクチャは汎用 CPU をターゲットとして研究が行われてきたため,それとは大きく性質が異なる SIMD ベースの GPU では命令セットの性質(主に命令間の参照距離の性質や,これに基づくバイナリ生成時の効率)が大きく異なる.このため,前年度に引き続き今年度も GPU 向けに Dualflow アーキテクチャを導入するための検討と評価を行った.今年度までの研究により,NVIDIA の GPU が持つ命令セットを拡張して Dualflow アーキテクチャによる距離表限を組み込んだ新たな命令セットの基本的な策定が終わり,ベンチマークプログラムをシミュレータ上で評価し検証を行った. 2. マイクロアーキテクチャに関する要素技術の研究 GPU への Dualflow アーキテクチャの導入にあたって,それを具体的に実現するためのマイクロアーキテクチャを研究した.これまでに GPU シミュレータへの Dualflow 命令の実装を継続して行ってきており,今年度はこのシミュレータを用いてより詳細な検討や評価を行った.これらの実装や評価の過程で,GPU が元から持つスケジューラを活用することで,従来想定していたよりもより少ない変更で GPU に提案手法を実装する方法を発案した. 上記の命令セットやマイクロアーキテクチャに関する要素技術の研究の結果,一部ベンチマークでは大きな性能向上を確かめたものの,Dualflow アーキテクチャによる命令数増加により返って性能が低下してしまう場合があり,この点が次年度以降で解決すべき課題となった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
上記の研究を実施するにあたり,これまで GPGPUSim と呼ばれる GPU シミュレータをベースに,Dualflow アーキテクチャを実装してきた.今年度はさらにシミュレータの入力となる命令列を生成するためのコード生成器をシミュレータと並行して実装した.これらの実装はコロナ渦の影響もあり,当初の予定よりも実装が遅れているものの,GPGPU の研究で一般に用いられているベンチマークをある程度実際に検証可能なまで実装が進んでおり,今年度は速度などの評価を実際に行う事ができた.また,このシミュレータやコード生成器の実装を通じ,Dualflow アーキテクチャを導入するための多くの知見を得ることができた.
|
今後の研究の推進方策 |
現在のコード生成器が生成する命令列は効率が悪く,一部のプログラムにおいて命令数が増加してしまう傾向がある.今後はこの命令数増加を抑えるためのコード生成アルゴリズムや,あるいは命令セットの工夫について研究を行う.また,これまでは命令数や性能のみを評価してきたが,今後は提案するアーキテクチャの消費電力を評価するための基盤を整える.
|