ゲノムプロジェクトの進展にともない、さまざまな生物種の遺伝子がカタログ化されてくると、多くの遺伝子がde novoに生み出されていることが明らかになった。ここでは、遺伝子のde novo誕生の機序に迫るバイオインフォマティクス研究を展開する。具体的には、体系的で網羅的な解析によるde novo遺伝子のカタログ化研究が行なわれたSaccharomyces cerevisiaeについて、まず、de novo遺伝子の相同領域のゲノム配列を近縁種間で比較して、遺伝子がde novoに誕生した前後の共通祖先のゲノム配列を推定する。そして、それらのゲノム配列について、遺伝子のde novo誕生の前後に蓄積された突然変異や塩基配列に観察される統計的な性質を調べ、それらの性質から、遺伝子のde novo誕生に関するシナリオを導出する。統計的な性質として、ここでは、(a)蓄積された突然変異の種類と頻度、(b)GC含量の変化、(c)ORFの伸長と縮退、(d)翻訳開始シグナルの生成と消滅を調べた。
その結果、(a)遺伝子のde novo誕生の前後に蓄積される突然変異は、中立であること、(b)遺伝子のde novo誕生の前後のゲノム配列は、いずれも、統計的に有意に高いGC含量を示すこと、(c)遺伝子のde novo誕生の前後で、統計的に有意な数のORF長の伸長が観察されること、(d)遺伝子のde novo誕生の前後で、統計的に有意な数の翻訳開始シグナルの生成は観察されないことが明らかになった。これらの知見に先行研究による知見(de novo遺伝子は、その年齢が増すにつれて、翻訳開始シグナルを持つ割合いを増す)を加えることで、遺伝子のde novo誕生に関する次のようなシナリオを導出することができた。(1)はじめに高GC含量ありき、(2)そのゲノム配列に中立な突然変異が蓄積する。続いて、(3)ORF長の伸長が起こり、遅れて、(4)翻訳開始シグナルが生成される。
|