研究概要 |
ギガシークエンサーは,短い断片配列(リード)を大量に出力するため,高速な解析技術の開発が急務となっている.本研究では,オフセット付き鳩ノ巣原理を応用し,大量のリードから超高速に類似配列を発見するアルゴリズムSlideSortを開発した. SlideSortは従来手法と比較して,同程度のメモリで1000倍以上の速度向上を達成した.考案したアルゴリズムの応用例として,最小全域木を構築するソフトウェアの開発も行った.類似ペア検索の応用範囲は広く,上記に述べたクラスタリングの他にも,共通パターンの発見,アセンブリの効率化などに役立つと期待される.
|