研究課題/領域番号 |
15J09761
|
研究機関 | 慶應義塾大学 |
研究代表者 |
鈴木 勇介 慶應義塾大学, 理工学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2015-04-24 – 2018-03-31
|
キーワード | GPU / Virtualization / Multi-tenancy / GPGPU |
研究実績の概要 |
GPU での大規模な計算を安定して行うためには,GPU をクラウド環境において第一級の計算資源とする必要がある.そのためには,GPU を共有可能,スケジュール可能かつ信頼性のある計算資源とする必要がある. 本年度は,GPU をアイソレーションを保った状態で共有することができる計算資源とするためのデザインの検討,実装及び整理を行い,詳細な実験によってデザインの違いからくるトレードオフを明らかにした.このデザイン及び明らかとなったトレードオフは広く GPU の仮想化による共有において議論する際の基盤となるものである.その結果をジャーナルに投稿し,IEEE Transactions on Computers に採録が決定している. また,これまでの研究によって,GPU をアイソレーションを保った状態で共有することができる計算資源とすることができた.そこで,GPU の利用における事例の調査,ドライバ,コンパイラ,ランタイムの実装の調査を行い,信頼性のある大規模計算を行うことができるかを確認した.その結果,現在の GPU におけるノンプリエンプティブな性質が GPU の計算資源としての利用を大きく妨げ,バグのある,もしくは悪意のある GPU アプリケーションのみならず,近年研究において用いられているデザインに則った正当なアプリケーションですら GPU を占有してしまいうることがわかった.容易に占有がなされてしまう状態では信頼性を求めるアプリケーションを動作させることは出来ない.そこで,GPU の状態を保存し,また回復する手法を用いた GPU アプリケーションのスケジューリングのデザインを検討,実装し評価した.この成果の経過については,ワークショップに投稿し,Workshop on Multicore and Rack-scale Systems にて採択され発表予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
GPU の仮想化による共有について仮想化のレイヤを変えることによるいくつかのアプローチとそれぞれのトレ ードオフを明らかにした.これら近年の GPU の仮想化における研究の進展は,GPU を共有し,計算資源として利用することを可能とする.そこで,GPU を計算資源として共有するにあたって,近年の GPGPU アプリケーションにおいて適切に動作するかどうかを調査した.結果,近年の研究ではアプリケーションは GPU を占有していることを前提に記述されており,GPU 上での高い性能のためビジーループを行うデザインが取られている場 合があることがわかった.GPU はノンプリエンプティブであることから,あるアプリケーションが GPU 上で計算を実行し続けた場合,他の GPU アプリケーションが GPU を用いることができず,GPU は占有されてしまう .このような状況下では,レイテンシに制約を持つようなアプリケーションにおいて信頼できる計算資源とは 言えない. この状況を解決すべく,効率的な GPU アプリケーションのスケジューリングを行うための新しいフレームワークをデザインし,実装した.このフレームワークは新しいプログラミング・モデルを導入し,細粒度でのスケ ジューリングを可能にする.事前実験の結果,フレームワークは低いオーバーヘッドながらスケジューリング による複数の GPU アプリケーション間でのフェア・シェアを達成した.現在までのデザイン,実装及び事前実験を論文にまとめ,ワークショップに投稿し,Workshop on Multicore and Rack-scale Systems 採択され発表予定である.
|
今後の研究の推進方策 |
今後の予定としては,ワークショップでの発表後,領域を同じくする研究者らとの討論や査読結果を元に研究 の方向を固める.具体的にはデザイン上の残る問題を解決し,実装をすすめ,予定通りより大規模な GPU アプリケーションに対して提案フレームワークを適用し,評価を行う.また,現状よりより幅広い問題に対して適 用可能かどうか,広く一般に長時間 GPU を用いるものに対して本研究が適用できるかどうかについて調査,検討する. また,事前実験の過程で,GPU をスケジューリングしたほうが性能が向上するケースが存在することが確かめ られた.これは,与えられた GPU カーネルを適切に分割してスケジュールすることで,通常実行した場合よりも高い性能を得ることができる可能性があることを示している.これについても,より詳細に調査し,適切な スケジューリングを行うためにデザインを修正する予定である. これら成果を論文にまとめ,国際会議論文として投稿する予定である.
|