研究実績の概要 |
次世代シークエンシングにより得た217,255,686リードから、5'末端アダプター配列を含みかつアダプターの下流に30塩基以上を持つリードを選別することにより、46,457,392リードのRNA 5'末端配列を得た。それらをbowtie2によりリファレンス配列にマッピングした後、coverageが5以上を判定基準とし、3,220箇所の転写開始点(TSS)を見出した。 まずはじめに、TSSの上流50塩基(-50~-1)を抽出し、アラインメントして最尤法による系統関係を調べたが、特徴的な領域あるいは配列は見出されなかった。 次に、同じく上流50塩基領域における任意の6-merの分布を調べ、当該領域中に5回以上出現し、その出現場所のバラつき(SD)が5以下のk-merが79個抽出した結果、-10周辺に偏って存在するk-merが多数見出されたほか、さらに上流に偏って存在する配列も少数ながら見出された。これらの多くは大腸菌等で知られている-10と-35配列に相当すると考えられるが、-45近辺に見出されたものは新規なプロモーター関連配列の可能性が示唆された。
|