2012 Fiscal Year Annual Research Report
大量ゲノム情報に対する配列相同性検索を中心とする大規模配列解析の研究
Project/Area Number |
12J08766
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
鈴木 脩司 東京工業大学, 大学院・情報理工学研究科, 特別研究員(DC1)
|
Keywords | 配列相同性検索 / メタゲノム解析 / GPGPU |
Research Abstract |
DNA配列の読み取り技術は日々進歩しており,単位時間当たりの解読量は急速に増加する傾向にある.さらに,現在,新しいDNA配列の読み取り技術を用いた次々世代シークエンサが開発され,今以上に長いDNA断片配列や十倍以上の大量なデータが読み取れるようになると予想されている.このため,次々世代シークエンサに対応可能な高速な配列解析の技術が必要とされている. 本研究は大規模配列解析の高速化という観点からメタゲノムの配列の高速な配列相同性検索ツールとしてGraphics Processing Unit(GPU)を用いた「GHOSTM」とアルゴリズムを工夫することで高速化した「GHOSTX」の開発を行い,次世代、そして次々世代DNAシークエンサに対応したソフトウェアの開発を行うものである.第一年度は1.GPUを用いた配列相同性検索ツールGHOSTMの開発,2.GHOSTXのキャッシュによる検索の高速化,3.GHOSTMについては大規模計算機による実行を実施し,それぞれで従来用いられてきたBLASTと比較し検索の精度を保ったまま高速化した. 第一の,Graphics Processing Unit(GPU)を活用した高速化のアプローチでは,独自のGHOSTMソフトウェアを完成し,その成果が著名な国際論文誌であるPLoSONE誌に掲載された.これに関連して,GPU関連の国際会議での審査付きポスター発表も,本年度内に2件採択された. 第二の,キャッシュメモリを活かした局所的な表引きと二分探索の併用による部分文字列検索の高速化の方法を新規に考案し,自身が開発中の独自ソフトウェアGHOSTXを従来の2倍程度高速化することに成功した.この成果は,情報処理学会第29回バイオ情報研究会において発表した. 第三の,超大規模GPU環境上にシステムを実装し,the International Conference on High Perfomance Computing, Networking, Storage and Analysis(SC'12)にてポスター発表が採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度で研究計画にある東京工業大学が有するTSUBAME2上でGPUを用いた配列相同性検索の高速化を行い,またTSUBAME2の全ノードを用いた大規模な配列相同性検索の実行についての発表も行った.このため,概ね順調に進展しているといえる.
|
Strategy for Future Research Activity |
今後は次々世代シークエンサが出力する長いDNA断片配列にも対応について研究を行う.これを実施する上で、DNA断片配列が長くなっているため配列相同性検索の際に考慮しなければいけないデータベースの配列の数が増加する.このため、従来よりも効率的な配列相同性検索が必要となっている.この問題を解決するために,最適なDNA断片配列の分割数やデータベースの分割数を明らかにし,効率的な検索の分散処理を行えるようにする.
|
Research Products
(5 results)