2013 Fiscal Year Annual Research Report
大量ゲノム情報に対する配列相同性検索を中心とする大規模配列解析の研究
Project/Area Number |
12J08766
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
鈴木 脩司 東京工業大学, 大学院情報理工学研究科, 特別研究員(DC1)
|
Keywords | 配列相同性検索 / メタゲノム解析 |
Research Abstract |
DNA配列の読み取り技術は日々進歩しており, 単位時間当たりの解読量は急速に増加する傾向にある. さらに, 現在, 新しいDNA配列の読み取り技術を用いた次々世代シークエンサが開発され, 今以上に長いDNA断片配列や十倍以上の大量なデータが読み取れるようになると予想されている. このため, 次々世代シークエンサに対応可能な高速な配列解析の技術が必要とされている. 本研究は大規模配列解析の高速化という観点から次世代、そして次々世代DNAシークエンサに対応したメタゲノムの配列の高速な配列相同性検索ッールの開発を行うものである. 第二年度は1. データベースの部分文字列のクラスタリングを組み合わせて配列相同性検索を高速化した手法の提案, 2. 今後、配列相同性検索と組み合わせる計画であるアセンブリの高速化のために非常に計算時間のかかるK-merの頻度カウントの高速な手法の提案を行った. 第一の, データベースの部分文字列のクラスタリングを組み合わせて配列相同性検索を高速化した手法の提案し, 従来の手法よりも約2倍程度高速化することに成功した. この成果は情報処理学会バイオ情報学研究会第34回研究会において発表した. 第二の, K-merの頻度カウントの高速な手法はGPUや並列化効率を上げることによって従来手法よりも約2倍程度高速化を達成し, GPU Technology Conference2014にてポスター発表が採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度で研究計画にあるクラスタリングを組み合わせた配列相同性検索の高速化を行い、今後、配列相同性検索と組み合わせる計画であるアセンブリの高速化のために非常に計算時間のかかるK-merの頻度カウントの高速化を行った. このため、概ね順調に進展しているといえる.
|
Strategy for Future Research Activity |
今後は次々世代シークエンサが出力する長いDNA断片配列にも対応について研究を行う. これを実施する上で、DNA断片配列のデータ量が増加を考慮する必要がある. このため、アセンブリと組み合わせた配列相同性検索の手法を開発し、効率的な配列相同性検索を行えるようにする.
|
Research Products
(2 results)