イルミナ社の次世代シーケンサーデータについて、マッピングソフトウェア maps の開発と、次世代シーケンサーを活用したseqメソッドと呼ばれる様々な解析手法についての検討を進めてきた。 (1)Gef-seq(ゲノムフットプリンティング)はいわゆるChIP-seqと呼ばれる手法に、DNAseを用いたdigestionを行うことにより、DNA結合タンパク質の認識配列を1塩基単位で特定することのできる精度をもたらすものである。maps を用いた枯草菌ゲノムのDNA結合タンパク質に関する解析結果をまとめた論文が受理された。 (2)mapsによるマッピングではリードあたりのエラーの数を多く許容できる特徴を活かして、リード内に組換点を含む為に、リードの両端でマップされる場所が異なるキメラ断片(ジャンクションリード)の検出により相同組換えなどの変異を検出する解析手法の開発を進めている。Preliminaryな結果からサンプル中に微量に存在する離れた場所同士の組換変異の検出が可能であり、共同研究者のデータの解析と論文の作成準備を進めている。 (3)ジャンクションリードを検出するプログラムの開発と並行して機器特異的エラーの解析を進めている。サンプル中一部の配列に起きている組換変異と、配列特異的エラーを区別することは(2)の解析でも重要である。 (4)mapsプログラム自身の改良として、複数染色体へのマッピング、可変長リードおよびペアエンドマッピングへの対応sam等の汎用出力フォーマットへの対応等、を進め公開の準備を進めている。 (5)学内の実験研究者と共同して、真核生物のゲノムアセンブルを進めている。Platanusなど公開されているソフトウェアの出力を元に、詳細な解析を行うためのツールを開発している。
|