2018 Fiscal Year Annual Research Report
Project/Area Number |
18H05860
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
兼田 充 東京大学, 素粒子物理国際研究センター, 特任助教 (10822033)
|
Project Period (FY) |
2018-08-24 – 2020-03-31
|
Keywords | 加速器 / 素粒子(実験) / 大規模計算 |
Outline of Annual Research Achievements |
世界最高エネルギー陽子陽子衝突型加速器LHCを用いた実験では世界規模の分散コンピューティングシステム、The Worldwide LHC Computing Grid (WLCG)を構築し膨大なデータを処理している。LHCを用いた実験の1つであるATLAS実験では常時30万から40万CPUコアを用いて実験データの処理やモンテカルロシミュレーションの生成を行っている。LHCでは2026年から衝突頻度を5倍にする計画があり取得されるデータ量も増えるが、現在の予算で見込めるコンピューティングシステムでは全てのデータを処理しきれないと見積もられている。そこで、本研究ではATLAS実験の計算環境としてGPGPUを導入しGPGPU用のソフトウェア開発を行うことで同規模の予算でも全てのデータを処理できる様に計算能力を向上させることが目的である。 2018年度にはまずGPGPUを設置できる計算機筐体を購入しATLAS実験の計算環境を導入し動作確認を行った。東京大学では世界中にあるWLCGサイトのうちの1つを運営しており、また日本グループ向けに直接利用できるリソースの提供も行っている。この直接利用環境においてGPGPUを用いたシステムを構築した。ATLAS実験用のソフトウェアやデータが扱える環境の中で実際にGPGPUを用いたテストジョブを流しGPGPUが利用できる事を確認した。2018年度に導入したGPGPUはNVIDIA Quadro P4000であり、GPGPUの性能としては余り高いものではないがプログラムによっては実行時間をCPUの半分ほどの時間に短縮出来る事が確認できた。 このGPGPUを使える環境をCPUのみを用いた環境と同じ状態で開発、テストを行える様構築し、ATLASの実験の日本グループに対して公開し利用を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ATLAS実験では2026年のLHCのアップグレードによる衝突頻度の増加において、現在のコンピューティングシステムでは十分な処理が行えないと見積もられている。これに対処するためにソフトウェアの改善やコンピューティングシステム自体に新しいアイデアを導入することが研究されている。現在ATLAS実験では機械学習を用いた検出器データの再構成や物理解析などを多く行っているがGPGPUを使える環境は十分に整っておらずGPGPU用のソフトウェアの開発も進んでいない。東京大学のATLAS用のコンピューティングセンターにおいてもこれまでGPGPUを使える環境はなかった。 これに対し、本研究により新たにNVIDIAのGPGPU、Quadro P4000を載せたGPGPU用抗体を導入した。コンピューティングセンター内に設置し、ATLAS実験用のソフトウェアの導入や環境構築を行った。環境設定には環境構築ツールPuppetを用い手順を確立した。GPU関連のツールに関してもCUDAなどの導入や環境設定の手順を確立した。 日本グループが直接利用する環境のため、環境設定の手順を確立し実際にGPGPUを使える環境を整えた。この環境下でGPGPUを使うテストプログラムを実行し、GPGPUの利用を確認した。また同じプログラムの中でATLAS実験のソフトウェアやデータへのアクセスが出来る事を確認した。 これまでに開発されたソフトウェアの中にTenrsorflowなどを用いた機械学習を使ったものがあるが、これらに関してはPythonのライブラリを変更するだけでGPGPUを利用することができ、実際に動作確認を行いQuadro P4000であっても現在利用中のCPU環境に比べ高速化出来る事が確認できた。
|
Strategy for Future Research Activity |
2018年度の研究によりGPGPUを用いたATLAS実験用のソフトウェア環境を構築する手順を確立した。2019年度にはこの環境を使い、GPGPU用にソフトウェアの開発を行う。まずは機械学習を用いている物理解析用ソフトウェアにおいてGPGPUを使える様に変更しテストを行う。これらはGPGPUを使うライブラリがあれば比較的容易に行える。また、検出器情報の再構成を行うプログラムやシミュレーションプログラムに関してもGPGPU利用に向けた開発を行う。これらに関してはまず並列計算が可能な箇所を研究しGPGPU用のプログラムを開発する必要がある。実際に開発したプログラムをGPGPU環境で実行しパフォーマンスを測定しCPUと比較したコストパフォーマンスも測定する。 2018年度にはNVIDIA Quadro P4000を購入したが、本年度にはより強力なGPGPUを購入し性能比較やコストパフォーマンスの比較を行う。 また、ジョブ管理ツールHTCondorを用いてGPGPUを用いたバッチシステムの開発を行う。バッチシステムには商用クラウドを利用した計算機インスタンスを用い複数のインスタンスを利用しバッチ処理を行えるシステムにする。このシステムをWLCGのシステムに組み込み、ATLASのプロダクションシステムとしてのテストを行う。
|