2009 Fiscal Year Annual Research Report
超ハイスループットシークエンスデータ解析を目指した高速配列解析環境の構築
Project/Area Number |
21510217
|
Research Institution | National Institute of Agrobiological Sciences |
Principal Investigator |
末次 克行 National Institute of Agrobiological Sciences, 昆虫ゲノム研究・情報解析ユニット, 主任研究員 (80533471)
|
Co-Investigator(Kenkyū-buntansha) |
舟橋 啓 慶應義塾大学, 理工学部・生命情報学科, 准教授 (70324548)
|
Keywords | 情報工学 / ゲノム / GPGPU / 配列解析 / 並列処理 |
Research Abstract |
本研究はGPGPU(General Purpose computation on Graphic Processing Unit)を利用することで高速・低コストな配列解析環境の構築を目指している。本年度は、多くの配列解析アルゴリズムの中からいくつかターゲットを選んで、GPGPUによる並列化方法の検討と実装を行なった。また、実装と評価を通してGPGPUにおいて高い性能を得るための知識の蓄積も進めた。その一つとして、2配列比較の代表的なアルゴリズムであるSmith-Watermanアルゴリズム(SWA)のGPGPUに適した並列アルゴリズムの開発と実装も行った。 SWAではダイナミックプログラミング(DP)法によりスコア行列を計算するが、比較対象となる配列が長くなると計算時間が膨大となる。スコア行列内のある要素を埋めるには隣接した3つの要素のスコアが必要なため、全要素のスコアを同時に計算することは出来ない。しかし、スコア行列の対角線方向については並列化が可能であることに着目し、細粒度並列化アルゴリズムを作成した。さらに、複数の問い合わせ配列を繋げて同時に処理を行う、細粒度並列化と粗粒度並列化を組み合わせたアルゴリズムを考案した。考案した並列化アルゴリズムを統合開発環境CUDA上で実装し、長さ500~25kbpの塩基配列を用いて、C++で実装した逐次実行版との処理速度比較を行った。細粒度並列化のみ実装した場合には、問い合わせ配列長が短い場合には性能向上が十分でなかったが、細粒度並列化と粗粒度並列化を組み合わせることにより、あらゆる長さの問い合わせ配列に対して安定した速度向上を実現した。GPGPUを配列解析に適用することで、ゲノム解析分野において広く用いられているPCクラスターと比較して低コストで省スペース性に優れた計算基盤を構築できることが示された。
|
Research Products
(1 results)