研究実績の概要 |
哺乳類のゲノムはトランスポゾンなどに由来する反復配列が約半分もの領域を占める。その中にはウイルス由来の配列(endogenous viral elements, EVE)がある(ヒトゲノムの約8%)。EVEの主な由来は、生殖細胞に感染したレトロウイルスのゲノム配列が宿主のゲノムに挿入されて、子孫に伝搬するようになった内在性レトロウイルス(endogenous retroviruses, ERV)であり、ウイルスの構造やその生成に関与する蛋白質をコードする遺伝子がある。本研究ではウイルスによる哺乳類のダイナミックな進化を明らかにするため、ヒトを含めた19種の哺乳類の標準ゲノム配列(20配列)を用いてERV/EVEの比較ゲノム進化解析を行う。そのためにERV/EVEのデータベースの作成を行った。ERV/EVE を探索するために使用されるコンピュータプログラムに加えてすべてのウイルスの遺伝子検索をクエリーとして相同性検索を行い、各ゲノムに残っているウイルス由来の領域を同定した。結果として20ゲノム配列から合計して736,771配列のERV/EVEを発見した。いままで知られているERV由来の機能遺伝子などを含んでいることなどを確認し、いままで報告されていない配列も多く含んでいることを確認した。また、pol由来の配列が最も多かったが、これはLINEのpolが入り込んでしまったためであると考えられ、現在これらを区別するようなアノテーションを行っている。次世代シーケンサ解析を迅速に行うためGTFフォーマットも作成し、網羅的なERV/EVEの発現解析を行えることも確認した。本結果を相同性比較の結果などをまとめてデータベースとして一般に公開し、幅広い解析に活用できるように整備を進めている(http://geve.med.u-tokai.ac.jp)。
|