2022 Fiscal Year Final Research Report
Development of GPU framework for high-speed analysis of omics data
Project/Area Number |
21K21281
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
1001:Information science, computer engineering, and related fields
|
Research Institution | Tokyo Medical and Dental University |
Principal Investigator |
Ito Satoshi 東京医科歯科大学, M&Dデータ科学センター, 助教 (30525358)
|
Project Period (FY) |
2021-08-30 – 2023-03-31
|
Keywords | 全ゲノム解析 / GPU / HPC |
Outline of Final Research Achievements |
We developed the basic functionality required to implement a whole genome analysis pipeline on a GPU. In particular, We focused on MarkDuplicates and I/O, which are difficult to parallelize and require the most computation time. 1. We employed a judgment algorithm in MarkDuplicates that does not use pair read information. This improvement eliminate the acquisition of pair read information at distant locations within a file, establishes data locality in the judgment process, and dramatically improves processing speed. 2. We developed a new I/O functions that read/write data using a large size buffer to remove small data size read/write. The buffer size is 100-200MB and the BGZF data for read/write are compressed/decompressed all at ones.
|
Free Research Field |
計算科学
|
Academic Significance and Societal Importance of the Research Achievements |
スーパーコンピュータやクラウドでの計算が期待するほどの劇的な高速化を得にくい現状において、ParabricsとDRAGENシステムだけがGPU/FPGAによる圧倒的な高速解析を実現した成功例である。一方で、これらは改変不可能なブラックボックスであり、範囲外の解析ではその恩恵を享受できない。本ソフトウェアは、ブラックボックス部分を開発者自身で組み上げることを可能にする環境である。BAM作成時点で既存解析フローが適用できない研究が散見されており、そのような分野に対する高速ソフト開発が加速することが期待できる。
|