2011 Fiscal Year Annual Research Report
超ハイスループットシークエンスデータ解析を目指した高速配列解析環境の構築
Project/Area Number |
21510217
|
Research Institution | National Institute of Agrobiological Sciences |
Principal Investigator |
末次 克行 独立行政法人農業生物資源研究所, 昆虫ゲノム研究ユニット, 主任研究員 (80533471)
|
Co-Investigator(Kenkyū-buntansha) |
舟橋 啓 慶應義塾大学, 理工学部・生命情報学科, 准教授 (70324548)
|
Keywords | 情報工学 / ゲノム / GPGPU / 配列解析 / 並列処理 / バイオインフォマティクス |
Research Abstract |
今年度は計算量が0(n)から0(n^3)までの6種類の配列解析アルゴリズムについてGPGPUを用いた高速化を行った。データサイズが大きい場合、すべての解析についてCPUを用いた逐次処理と比べて高速化を達成した。特に計算量が0(n)を超える解析では、SSEやマルチコアCPUを用いた実装と比べて最大で2桁以上の高速化に成功した。一例として、SSE(Streaming SIMD Extension)やLazy-F valueなどを用いて最適化された既存の配列解析ソフトウェアであるSSEARCHと、本研究でGPGPUにより実装したSmith-Waterman algorithmの処理時間の比較結果を以下に述べる。SSEARCHはギャップペナルティの合計値によって処理時間に影響があるが本研究ではその影響はなく、ギャップペナルティが4/3のとき平均で7.0倍、最大で11.2倍の高速化を達成した。また、複数のGPUを用いた実装を行った場合、GPUの台数に応じた処理時間の短縮を確認することができた。これにより、大量のデータに対して配列解析を行う際に複数のGPUを用いることは非常に有用であることが確認された。一方で、計算量が0(n)の配列解析における高速化度合は低かった。これは並列化による計算の効率化に対し、GPU-CPU間のデータ転送などGPGPU特有の処理によるオーバーヘッドの割合が高かったためであると考えられる。現在、上記成果内容について論文を執筆中である。実装したソフトウェアライブラリは論文採択後に公開を行う予定である。
|