研究概要 |
最尤法による分子系統樹推定に際し、モデルのミススペシフィケーションがどのような推定の偏りを与えるかを調べた。ゲノムプロジェクトの成果として、ゲノム規模の塩基配列データが次々に生み出されるようになり、そのような大規模データによる系統樹推定(ゲノム系統学)が盛んに行われるようになってきた。データが増えるに従って、当然サンプリング誤差は限りなく小さくなり、特定の系統樹が見かけ上は高い信頼度で支持されるようになる。ところが、系統樹推定に偏りがあれば、間違った系統樹が強く支持されてしまう危険が増えてきたともいえる。真獣類は、1億年ほど前の3つの大陸に対応して、北方獣類(ローラシア大陸)、アフリカ獣類(アフリカ)、異節類(南米大陸)の3つの主要なグループから成ることが明らかにされたが(Nishihara, Hasegawa & Okada, PNAS 2006)、この3者の間の分岐の順番に関しては不明であった。われわれはこの問題を明らかにするため、ゲノムプロジェクトが進んでいる9種の真獣類と有袋類1種について、100万塩基に及ぶたんぱく質コード領域の配列をアラインメントして、さまざまなモデルによる系統樹推定を行った。その結果、一般によく行われるconcatenate解析では、コドン置換モデルのように塩基座位間の相関を取り入れない限り、間違っていると思われる系統樹が強く支持されることを見出した。そのような場合でも、遺伝子ごとの進化速度、パターンの違いを取り入れたseparate解析では、置換モデルの詳細に依らずに一貫して正しいと思われる系統樹を支持する。このことは、ゲノム規模の分子系統樹解析においては、遺伝子ごとの違いを考慮した解析が必要であることを示しており、ゲノム系統学における解析法の重要性を強く認識させるものである(Nishihara, Okada & Hasegawa,投稿中)。
|