研究概要 |
DNA配列の読み取り技術は日々進歩しており, 単位時間当たりの解読量は急速に増加する傾向にある. さらに, 現在, 新しいDNA配列の読み取り技術を用いた次々世代シークエンサが開発され, 今以上に長いDNA断片配列や十倍以上の大量なデータが読み取れるようになると予想されている. このため, 次々世代シークエンサに対応可能な高速な配列解析の技術が必要とされている. 本研究は大規模配列解析の高速化という観点から次世代、そして次々世代DNAシークエンサに対応したメタゲノムの配列の高速な配列相同性検索ッールの開発を行うものである. 第二年度は1. データベースの部分文字列のクラスタリングを組み合わせて配列相同性検索を高速化した手法の提案, 2. 今後、配列相同性検索と組み合わせる計画であるアセンブリの高速化のために非常に計算時間のかかるK-merの頻度カウントの高速な手法の提案を行った. 第一の, データベースの部分文字列のクラスタリングを組み合わせて配列相同性検索を高速化した手法の提案し, 従来の手法よりも約2倍程度高速化することに成功した. この成果は情報処理学会バイオ情報学研究会第34回研究会において発表した. 第二の, K-merの頻度カウントの高速な手法はGPUや並列化効率を上げることによって従来手法よりも約2倍程度高速化を達成し, GPU Technology Conference2014にてポスター発表が採択された.
|