研究課題/領域番号 |
20K21826
|
研究機関 | 東京大学 |
研究代表者 |
笠原 雅弘 東京大学, 大学院新領域創成科学研究科, 准教授 (60376605)
|
研究期間 (年度) |
2020-07-30 – 2023-03-31
|
キーワード | 不揮発メモリー / アルゴリズム / 配列アラインメント / ゲノムデータベース |
研究実績の概要 |
いわゆる次世代DNAシークエンサーの登場により、ゲノム解析で大容量のメモリーを必要とする場面がこの15年で激増した。このため、ゲノム計算に特化した大規模計算機センターでは2TB程度のメモリーを搭載した計算ノードを多数用意し、それ以上のメモリを搭載した高価な計算ノードを用意していることもある。高価な計算機はDNAシークエンサーの価格が1億円であれば問題にならないが、Oxford Nanopore Technologies 社が約10万円のMinIONシークエンサーを販売しはじめてからは大きな問題になりつつある。 そこで、本研究では高価なDRAMメモリーの代わりにビット単価がより安価な不揮発メモリーを用いてDRAMの消費量を抑制しつつ様々なゲノムアルゴリズムを実行できるように新規アルゴリズムを開発することを目指した。本年度は不揮発メモリーとビットマップベースのグラフアルゴリズムを組み合わせて、大容量のDNA配列データベースに対 する特殊な不揮発メモリー上のデータベースインデックスを作成し、大容量のDRAMを多く必要とせずにデータベースサイズが極めて大きい場合でも効率的な配列検索が多数の配列に対して並列に行える新規のインデックス手法を考案した。 本手法を用いた配列検索アルゴリズムは、不揮発メモリーの特性下でも性能が低下しにくくDRAMの消費量も従来法と比べると大きく抑えることができる。DRAMと安価な市販の不揮発メモリーの最も大きな差は小さな読み書き単位でランダムアクセスを行った際のレイテンシーの大きさであるが、本インデックス手法では読み書き単位をなるべく大きくしランダムアクセスの数を少なく抑えることで性能低下を抑えていることが特徴となる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
理論的なアルゴリズム検討については事前の期待以上に進行している。しかし、研究申請時に利用することを想定していた不揮発メモリーの一つである Intel社 の Optane メモリーは、以前の Intel 社の宣伝に反して極めて高値で推移しているため(正確には Optane メモリーを搭載したシステム全体の価格が高い)DRAM を用いたシステムに対するコストパフォーマンス優位性が、ゲノム解析アルゴリズムにおいては今のところほぼゼロであり、その点では大きな軌道修正を強いられている。このため、全体としてはおおむね順調とした。
|
今後の研究の推進方策 |
引き続きアルゴリズム面およびソフトウェア実装の改良を進め、不揮発メモリーを用いた省DRAMメモリーのゲノム解析アルゴリズム実装を進めていく。また、本研究で開発している大容量データベースに対する検索アルゴリズムの実応用を共同研究者とともに進め、不揮発メモリーの低コスト性が実際に有用となるケースの実証を行っていく。
|
次年度使用額が生じた理由 |
研究申請時に利用することを想定していた不揮発メモリーの一つである Intel社 の Optane メモリーは、以前の Intel 社の宣伝に反して極めて高値で推移しているため(正確には Optane メモリーを搭載したシステム全体の価格が高い)DRAM を用いたシステムに対するコストパフォーマンス優位性が、ゲノム解析アルゴリズムにおいては今のところほぼゼロであり、またこのため、本予算で Optane メモリーを大量に搭載したシステムを購入するためには金額が不足していた。このため、Gen 4 PCI Express 接続の SSD を数多く搭載し IOPS を増やした不揮発メモリーストレージを次年度に導入し、当初の目的に沿った不揮発メモリーアルゴリズム開発を目指す。
|