2014 Fiscal Year Research-status Report
完全線形符号に基づくDNAの符号化によるゲノムマッピングの高速化
Project/Area Number |
24650155
|
Research Institution | Osaka University |
Principal Investigator |
竹中 要一 大阪大学, 情報科学研究科, 准教授 (00324830)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | アライメント / ゲノム / 完全線形符号 / ガロア拡大体 |
Outline of Annual Research Achievements |
研究計画の3年目である平成26年度は,2年目に設計,実装したアルゴリズム,ソフトウェアの並列化を行った.
昨年度の実装では,圧縮データ構造の一種であるBurrows-Wheeler変換を用いたが,既存ソフトウェアであるBowtieからの有意性を示す事ができなかった.あるDNA配列のゲノムアライメント結果は,他のDNA配列のアライメント結果とは独立である.そして入力として与えられるDNA配列数は膨大であるため,ゲノムアライメントの実装には並列化が有効であると考えた.そこでMPI,CUDA,Hadoop, OpenMP等の各種並列化技法を用いた実装の検討を行った.本研究では,規模の小さい演算である完全線形符号の誤り訂正を大量に実行する必要があるため,CUDAが有効であると考えていたが,圧縮データ構造で変換するデータが規模の大きなゲノム配列である事から,データ転送速度の問題が生じたCUDAを除外した.そこで,本年度の研究で必要な並列化は,単純なタスク並列化のため,Map&Reduce の使えるHadoop及びOpenMPを用いた.しかし想定していた程の効率性,すなわち他手法を大幅に超える性能を得る事ができなかった.そして,本項目に予想以上の時間を要してしまったため,他の配列解析手法への応用部分の研究に遅延を生じてしまった.そこで,最終年度を一年延長する事とした.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
昨年度までに実装した圧縮データ構造の一種であるBurrows-Wheeler変換を用いたゲノムマッピングソフトの並列化を行った.対象とした並列化技法は,MPI,CUDA,Hadoop, OpenMPである.昨年度の実績書に示した通り,並列化前の段階で提案手法は既存手法より優れているとは言い難かった事も影響し,並列化後にも研究計画において事前に想定していた程の効率性,性能を得る事ができなかった.また,想定する効率性,性能を得るための試みに時間を要したため,他のDNAゲノムアライメント配列への応用に遅延を来している. ただし,特にメタゲノム分野への応用において一定の成果を上げる事ができた. 以上により,(3) やや遅れているを選択するとともに,研究計画の一年延長を申請した.
|
Strategy for Future Research Activity |
来年度は,生物情報科学分野においてDNA配列を扱うゲノムアライメント以外のアルゴリズムへの応用研究を中心に実施する.
アライメントは生物情報学の基本アルゴリズムである.そのため他のDNA解析に関する多くの研究に関係している.そこで,これらのDNA配列を扱う研究において,完全線形符号が応用できないかの研究を昨年度に引き続き実施していく.すなわち,来年度は本年度の研究計画が遅延した部分を中心に実施する事となる.現在想定している応用分野は,ゲノムアセンブル,メタゲノム分類,メタゲノムアセンブル,そしてDNAのk-mer countingへの応用である.以上の分野を中心に,適用による有利不利を勘案しつつ優先順位をつけて順次実施していく.
|
Causes of Carryover |
研究計画に遅延が生じたため,1年の計画延長を行った. それに伴い,支出が遅延している.
|
Expenditure Plan for Carryover Budget |
本年度は備品は購入せず,主に消耗品及び旅費に利用する.
|
Research Products
(2 results)