研究実績の概要 |
DNA配列の読み取り技術は日々進歩しており, 単位時間当たりの解読量は急速に増加する傾向にある. さらに, 現在, 新しいDNA配列の読み取り技術を用いた次々世代シークエンサが開発され, 十倍以上の大量なデータが読み取れるようになると予想されている. このため, 次々世代シークエンサに対応可能な高速な配列解析の技術が必要とされている. 本研究は大規模配列解析の高速化という観点から次世代、そして次々世代DNAシークエンサに対応したメタゲノムの配列の高速な配列相同性検索ツールの開発を行うものである. 第三年度は第一年度で提案したsuffix arrayによる類似度に基づく可変長文字列比較による配列相同性検索の高速化した手法であるGHOSTXがPLOS ONE誌に掲載され、第二年度で提案したデータベースの部分文字列のクラスタリング情報を用いた配列相同性検索の手法であるGHOSTZがBioinformatics誌に掲載されることが決まった. また, このGHOSTZをgraphic processing unit(GPU)を用いて高速な配列相同性検索を行う手法を提案し, GHOSTZ-GPUソフトウェアとして実装を行った. このGHOSTZ-GPUを実際のメタゲノムのデータを利用して検証したところ, 12 CPU threadsと3 GPUsを利用した場合, GHOSTZの12 CPU threads利用時よりも最大約7倍の速度向上が得られ, この成果をGPU Technology Conference 2015にてポスター発表を行った.
|