本研究課題は大型真核ゲノム生物を対象とし、ゲノム配列決定後の遺伝子構造アノテーションを容易にする目的で新しいRNA-seq解析手法を実験的/情報解析的双方から試みるものである。 前者では、RNAより逆転写されたcDNAに対し3'末端を修飾保護し、5'側からExo3を用いた消化反応を実施、サンプルを一定時間に回収することで少しずつ5'側が削られた様々な長さのcDNA断片を得、両側をIlluminaによりシークエンスを行う。まず、通常のDNAサンプルを制限酵素処理することで、末端を揃えたDNA断片に対してExo3処理を施し一定時間ごとに回収することで、5'端を揃え3'端の長さが様々なサンプルの取得には成功した。続いて、これらのサンプルからIlluminaシークエンスライブラリの構築を試みた。長さが様々であることからpair-endとmate-pair双方のライブラリ調整法、シークエンスを実施したが、pair-endではおよそ800bpまでのサンプル、mate-pairでは2kb以上のサンプルのデータのみが回収される結果となり、その間の領域がうまくシークエンスできていないことが判明した。サンプルをいくつかに分画するなどの条件検討を試みたが、この問題は最後まで解決することはできなかった。 後者の情報解析手法の方では、配列のペア情報を活用することで5'端の揃った配列の相方を回収し、overlap-layout法を用いたアセンブル法を開発した。この手法は計算機場上でのシミュレーションデータでは期待された通りの挙動を示すことが確認されている。 当初の完全長遺伝子配列の再構成という目的は達成できていないが、同一遺伝子の5'側と3'側の情報の同時取得が可能なため、遺伝子境界を決定することが可能となり、通常のRNA-seqと組み合わせることによる遺伝子予測精度の向上は十分に期待できる。
|