研究課題/領域番号 |
20H04153
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60040:計算機システム関連
|
研究機関 | 東京大学 |
研究代表者 |
塩谷 亮太 東京大学, 大学院情報理工学系研究科, 准教授 (10619191)
|
研究分担者 |
坂井 修一 東京大学, 大学院情報理工学系研究科, 教授 (50291290)
入江 英嗣 東京大学, 大学院情報理工学系研究科, 教授 (50422407)
千葉 滋 東京大学, 大学院情報理工学系研究科, 教授 (80282713)
小泉 透 名古屋工業大学, 工学(系)研究科(研究院), 助教 (20981525)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2022年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2020年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
|
キーワード | 計算機アーキテクチャ / GPU / マイクロアーキテクチャ |
研究開始時の研究の概要 |
本研究では,申請者らを含むグループが研究を進めてきた Dualflow アーキテクチャに基づき,GPU のプログラマビリティを保ちながら電力効率の大きな改善を目指す.Dualflow アーキテクチャは制御駆動とデータ駆動の両方の性質を合わせ持つ独自の命令セット・アーキテクチャである.我々は,演算以外のデータ移動に関わる消費電力が GPU 内では非常に大きな割合を占めることに着目した.このデータ移動に関わる消費電力を Dualflow アーキテクチャの持つデータ駆動の性質を利用することによって大きく削減し,シミュレーションによる検証から実際の LSI 試作までを通して,その効果を明らかにする.
|
研究実績の概要 |
2021年度までの研究では,NVIDIA の SIMT 型 GPU が持つ命令セットを拡張し,距離指定型オペランド表現(あるいは Dualflow アーキテクチャ)を組み込んだ新たな命令セットを策定して評価検討を行っていた.この評価の結果,命令数がかえって増加してしまい性能が低下してしまう場合が多く見られた.この命令数の増加は,距離指定型オペランド表現では異なる制御フローを辿った場合にも参照距離を一定にするために,追加の命令が必要なためである. これに対し,2022年度には,上記の問題を解決するオペランド参照のハイブリッド方式を発案した.この方式では従来のレジスタ番号によるオペランド参照と提案する距離指定によるオペランド参照を選択して使用することができ,追加の命令が多く必要な場合は従来のレジスタ番号による参照を用いることで命令数の増加を回避する.この方式は out-of-order 実行を基本とする CPU では適用できず,マルチスレッディングと in-order 実行を基本とする GPU においてのみ実現可能であり,GPU において部分的な out-of-order 実行を可能にする. また,このハイブリッド方式に基づく,メモリアクセスの軽量なリオーダリング方式も発案した.このリオーダリング方式では,ハイブリッド方式においてレジスタ番号を使用して結果を書き込む命令がリオーダリングを阻害する事を逆に利用し,それを軽量なバリアとして用いる.これにより,特別な機構の追加く,非常に軽量にメモリリオーダリングの制御が可能になった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
上記のハイブリッド方式を実装し初期的な評価を行った.これまでの評価では非常に良好な結果を得ており,従来の提案方式が持つ問題をほぼ完全に解決して命令数をほとんど全く増加させずにコードを生成できるようになった.また,メモリアクセスのリオーダリングについてもこのハイブリッド方式を利用する形で,非常に効果的に実装できた. ただし,このハイブリッド方式は当初想定されていなかった事もあり,コードの生成系やシミュレータを全て実装し直すことになったため,当初の計画よりもそれらのために時間がかかった.
|
今後の研究の推進方策 |
上記のハイブリッド方式に基づくシミュレータやコード生成系の実装はある程度評価を行えるところまでは進んでいるものの,一部アプリケーションにまだ対応できていない部分がある.このため,不足している機能を補い,それらのアプリケーションへの対応を進める.また,これまでに実施できていない提案するアーキテクチャの回路面積や消費電力を評価するためのシミュレーション基盤やハードウェア実装を整える.
|