最終年度である本年度は、まず今までに開発したChIP-seqアルゴリズム、ゲノムアセンブル解析アルゴリズム、点変異解析アルゴリズムの改良を継続的に実施し、最終的なパイプラインとしてまとめあげた。さらにそれらを利用して他班員との共同研究により、出芽酵母、分裂酵母、ヒト、マウス、病原性バクテリアなど様々な生物種のデータについて、タンパク質局在プロファイルの解析、SNP検出、ゲノム構造変異解析を実施した。 また中でも新規性の高いゲノムアセンブル解析アルゴリズムは、新規de novoアセンブラとしてコードをまとめ論文化するとともにホームページから公開し、幅広く全世界の研究者に使用されている。本プログラムではバクテリアから通常の二倍体ゲノムへの適応が可能であるにとどまらず、相同染色体間の変異が大きい高ヘテロ接合性ゲノムのアセンブルにおいてよい成績が挙げられるのが大きな特徴となっている。 他にも今年度の特筆すべき成果としては、ゲノム変異解析において従来のmappingによる点変異および短い挿入欠失の検出に加えて、ペアリードがmappingされた距離情報に基づくゲノム構造変異候補をlocalなde novoアセンブルを組み合わせて絞り込むことでより高精度なゲノム構造変異検出が実現できるアルゴリズムの開発を実施した。このアルゴリズムをヒトの正常組織と癌組織由来のサンプルから取得したシークエンスデータに適応し、参照配列に対してそれぞれ検出された構造差異をみることで癌組織特有に入ったヘテロな構造変異を抽出することに成功した。
|