研究概要 |
DNA配列の読み取り技術は日々進歩しており,単位時間当たりの解読量は急速に増加する傾向にある.さらに,現在,新しいDNA配列の読み取り技術を用いた次々世代シークエンサが開発され,今以上に長いDNA断片配列や十倍以上の大量なデータが読み取れるようになると予想されている.このため,次々世代シークエンサに対応可能な高速な配列解析の技術が必要とされている. 本研究は大規模配列解析の高速化という観点からメタゲノムの配列の高速な配列相同性検索ツールとしてGraphics Processing Unit(GPU)を用いた「GHOSTM」とアルゴリズムを工夫することで高速化した「GHOSTX」の開発を行い,次世代、そして次々世代DNAシークエンサに対応したソフトウェアの開発を行うものである.第一年度は1.GPUを用いた配列相同性検索ツールGHOSTMの開発,2.GHOSTXのキャッシュによる検索の高速化,3.GHOSTMについては大規模計算機による実行を実施し,それぞれで従来用いられてきたBLASTと比較し検索の精度を保ったまま高速化した. 第一の,Graphics Processing Unit(GPU)を活用した高速化のアプローチでは,独自のGHOSTMソフトウェアを完成し,その成果が著名な国際論文誌であるPLoSONE誌に掲載された.これに関連して,GPU関連の国際会議での審査付きポスター発表も,本年度内に2件採択された. 第二の,キャッシュメモリを活かした局所的な表引きと二分探索の併用による部分文字列検索の高速化の方法を新規に考案し,自身が開発中の独自ソフトウェアGHOSTXを従来の2倍程度高速化することに成功した.この成果は,情報処理学会第29回バイオ情報研究会において発表した. 第三の,超大規模GPU環境上にシステムを実装し,the International Conference on High Perfomance Computing, Networking, Storage and Analysis(SC'12)にてポスター発表が採択された.
|