ゲノム系統学の諸問題においてモデルのミススペシフィケーションが系統樹推定にどのような偏りをもたらすのか、またそのような偏りをなくすにはどのようにモデルを改良していけば良いのかについて検討し、ポストゲノム時代にふさわしい系統樹推定法を確立することを目指している。 ゲノムの大量データから系統樹推定を行う際には、サンプリング誤差は限りなく小さくなるが、逆に推定の偏りに伴う誤差が顕著になる。ゲノムデータの解析を通じて真獣類の初期進化における系統関係を明らかにするために、系統樹推定の偏りを少なくするためのさまざまなモデル化を試みた。 始めに、蛋白質コード領域の配列データから分子系統樹推定する際に、アミノ酸の置換と塩基の同義置換を組み合わせたコドン単位の置換をモデル化したコドン置換モデルが有効であることを確かめた。 また、ゲノム規模のデータには、様々な進化速度や進化様式をもった遺伝子が含まれているので、遺伝子間の不均一性を無視した解析は推定の偏りを生み出す。それゆえ、遺伝子ごとの違いを正しく取り入れることが重要である。そこで遺伝子ごとに最適のモデルを選択した上で、大量の遺伝子ごとの解析結果を総合的に効率よく評価できる方法を開発している。
|