2016 Fiscal Year Annual Research Report
高速なヒトDNA解読実現のための小規模計算機システムの構築
Project/Area Number |
16J01690
|
Research Institution | University of Tsukuba |
Principal Investigator |
曽我部 陽光 筑波大学, システム情報工学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2016-04-22 – 2018-03-31
|
Keywords | FPGA / GPU / 遺伝子情報処理 / オーダーメイド医療 / 計算機システム |
Outline of Annual Research Achievements |
本研究は、ヒトの個体のDNA配列を決定するための情報処理を、書き換え可能なLSIであるFPGA(Field Programmable Gate Array)と画像処理用のプロセッサであるGPU(Graphics Processing Unit)を用いて高速化する研究である。DNAの塩基配列を高速に読み取る装置を、DNAシーケンサーと呼び、この装置から得られるデータは短いDNA断片(ショートリードと呼ぶ)である。ショートリードのままでは遺伝子解析に利用できず、ヒトゲノム計画等で得られた既知のヒトゲノムと照らし合わせる(マッピング)ことで、読み出されたDNAの遺伝的特徴を調べる。このマッピング処理は、DNAシーケンサーがショートリードを読みだす速度に比べて遅く、塩基配列決定処理のボトルネックになっている。 オーダーメイド医療と呼ばれる個人のDNA配列に基づいて病気の予測や治療法の推定などを行う新しい医療の実現が期待されており、そのためには、高速かつ低価格で個人のDNAを読み取る必要がある。 本研究では、新たに並列処理手法を提案し、FPGAとGPUを付加したPCという比較的小規模な計算機システムでショートリード・マッピングの高速化を図る。 当該年度は、大きく分けて2つの要素から成り立ち、前半は、これまでの研究で構築してきたFPGAシステムの改善および評価、後半はGPUシステムの構築及び評価を行った。FPGAシステムは、一人分のショートリードを1時間以内で処理できる水準に達しており、GPUシステムは、現時点で一人分のショートリードを10時間以内で処理できる水準である。FPGAシステムは、既存の手法と比べトップクラスの性能を示しており、オーダーメイド医療実現のための貢献ができたと言える。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は、ヒトの個体のDNA配列を決定するための情報処理であるショートリード・マッピングを高速に処理する計算機システムの構築を図るものであり、大きく分けて3つの要素から成り立つ:①書き換え可能なLSIであるFPGA(Field Programmable Gate Array)を用いた高速化、②GPU(Graphics Processing Unit)を用いた高速化、③FPGAおよびGPUを用いた高速化。ヒトの個体のDNA配列解析を一般化するため、低価格で処理したいので、性能以外にも、システムが安価で低消費電力であることが重要である。 ①のFPGAシステムについては、当該年度で十分な結論が得られた。その性能は、既存手法と比べトップクラスで、一人分のショートリードを1時間以内で処理できる。この性能は、既存ソフトウェアと比べると20倍以上である。また、FPGAであるために低消費電力であることも重要である。この結果については、査読付き英文論文誌で発表を行っている。 ②のGPUシステムについては、現在進捗中であり、概ね完成しているが、詳細な評価を加え来年度中には発表できるだろう。FPGAシステムに比べると、性能・消費電力面では劣るが、既存ソフトウェアと比べると十分高速で、設備費(導入費用)がFPGAより安く、また、GPUを用いた他の遺伝情報処理アプリケーションも充実しているため、FPGAと比べて優位な点はあると考えている。 ③については、今後の課題である。
|
Strategy for Future Research Activity |
本研究は、ヒトの個体のDNA配列を決定するための情報処理であるショートリード・マッピングを高速に処理する計算機システムの構築を図るものであり、今後の研究は大きく分けて3つの要素からなる:a)GPUシステム、b)FPGAとGPUを組み合わたシステム、c)新しいDNAシーケンサーへの対応。 a)については、一通り完成し、細かい性能改善の段階に来ている。GPUでは、SIMT(Single-Instruction-Multi-Threads)と呼ばれるプログラミングモデルが用いられ、複数のスレッドに対して1つの命令を共有する。そのため、実行されるスレッド内で条件分岐が発生した場合計算効率が低下する。また、高速アクセス・低容量な内部メモリを駆使することメモリアクセス・ボトルネックを回避する。GPUを効果的に用いるには、この2点が重要で、現在作成中のアプリケーションは、この2点に対応している。 b)については、FPGAまたはGPUで実行すると効率よい処理を明らかにし、最適にFPGA・GPUに割り振ることで、単体のシステムよりも効率的なシステムを目指す。 c)についての必要性は、低下したと考えている。DNAシーケンサーとは、DNAを断片化し読み取る装置であり、様々な手法が研究開発されている。それらのDNAシーケンサーは、読みだすDNA断片の長さ、読み出しのエラー率、性能、価格等が、主な比較要素であり、計画段階では、読みだすDNA断片の長さが今後増大すると見られていた。各手法のDNAシーケンサーは、それぞれムーアの法則を超える速度で性能向上しているが、未だにDNA断片の長さは50-200塩基長程度のDNAシーケンサーが性能・価格面でひと桁以上も優れている。したがって、当初予定したように、1000塩基長を超えるような長いDNA断片を生成するDNAシーケンサーへの対応の需要は下がったと考えている。
|