DNAシークエンサーの技術進歩により大規模なゲノム解析が従来より安価で気軽に実施できるようになった。このため、ゲノム解析で大容量のメモリーを必要とする場面が激増している。このため、ゲノム計算を明示的にサポートする大規模な学術用計算機センターではメモリーを大量に搭載した計算ノードを多数用意して、ユーザーが非常に大きなサイズのメモリーを用いる計算であっても実行可能としている。しかし、DNAシークエンサーとその試薬代の価格低下の速度は、計算機の速度向上と価格低下より速いため、計算機資源が相対的に高価になってきており、将来的にゲノム解析の大きなネックになる可能性が高い。 そこで、本研究では高価なDRAMメモリーの代わりにビット単価がより安価な不揮発メモリーを用いてシステム全体として高価なDRAMの消費量を抑制しつつ、様々なゲノム解析アルゴリズムを実行できるように新規アルゴリズムを開発することを目指した。本研究では不揮発メモリーとビットマップベースのグラフを用いた配列検索アルゴリズムに対して、ビットマップを圧縮することで、大量に必要としていた不揮発メモリーの使用量を削減したアルゴリズムを考案した。また、ビットマップベースのグラフを用いた場合には、検索して見つかったターゲット配列の配列メタデータを取得する計算効率/記憶容量効率の良い手法が存在しなかったが、ハッシュ関数を用いて配列そのものからメタデータへの索引を張る手法を考案し、この問題を軽減することができた。また、DNA配列を対象とした手法をアミノ酸配列の検索に対して拡張するべく理論的検討を行った。
|