1.非ゲノム解読領域におけるChIP-seq情報解析プログラムの研究開発 ChIP-seqにより得られるタンパク質等の結合状態の分布等のデータは、基本的にゲノム解読が終了した生物種において、免疫沈降画分から得られたDNAをシークエンスし、その配列を既知のゲノム情報にマッピングすることによって求めている。従って得られるプロファイルデータはゲノム解読領域に限られるが、ヒトなど高等真核生物でゲノムが解読されている領域はユークロマチン領域に限定されており、セントロメアなどのヘテロクロマチン領域は対象外となっており、これら領域でのプロファイルを得ることはできない。このため、これらゲノム未解読領域へのプロファイルを明らかにするため、マッピングされなかった配列をアセンブルするためのプログラム開発を実施した。ChIP-seq解析に主に用いられるシークエンサーはIllumina社のプラットフォームであることが多い。このため、100bp程度の比較的エラーレートの低い大量のデータに対応した、de bruijn graphを用いたアセンブルアルゴリズムによるプログラムの開発を行った。 2.高等真核生物をターゲットとしたChIP-seq情報解析プロトコルの確立 本年度は、研究最終年度であるため、昨年度までに研究開発した情報解析プロトコル改良し、さらに1.で開発した非ゲノム解読領域におけるChIP-seq情報解析プログラムを組み込み、最終的な高等真核生物をターゲットとしたChIP-seq情報解析プロトコルの確立を図った。これにより、ChIP-chip法よりも、より高解像度でより広いゲノム領域にアクセス可能なChIP-seq法の解析手法を確立することに成功した。
|