研究課題
挑戦的研究(萌芽)
ゲノム解析の様々な場面おいて利用される配列類似性検索において、公共配列データベース上に存在する配列など検索対象データベースのサイズが非常に大きくメモリー上に検索を高速化するための索引データ構造全体を格納することができない場合には、広く一般に用いられている類似性検索ソフトウェアより高速な検索を行うためにSSDなどの大容量記憶媒体を用いた索引データ構造が利用できることを見いだした。マッチ配列長さが短い場合には確率的データ構造が有効であることを見いだした。
ゲノム情報科学
DNA配列シークエンサーの発展に伴ってDNA配列解析に必要な試薬代や機器代は安くなっていくことが予想されているが、解析に必要な計算機資源を手に入れるコストはDNA配列シークエンサー関連のコスト低下ほど低下していない。本研究により生み出された手法により、大きなデータベースに対する配列検索が従来考えられていたよりも遙かに安価なハードウェアで高速に実行できるようになった。これにより、将来的に必要となっていたゲノム解析に対する計算機資源量を減らし節約をすることができる。