これまでベイズ推定によって水平移行を検出する方法の開発を行い、微生物ゲノムには10%を超えるような水平移行遺伝子があり、特に病原性細菌などで進化的に有利と思える遺伝子の移行が統計的に有意に多いことを明らかにしてきた。本課題では、特に高等真核生物も含めて水平遺伝子移行の実態を明らかにするため、この方法をイネの全遺伝子セットに対して適用した。イネの遺伝子において転写されている領域中の塩基配列を使用し、これらをコード領域と非コード領域に分けてトレーニングデータセットとした。また、植物病原菌で形質転換にもっとも良く利用されるアグロバクテリウムのゲノム(環状および線状の2本)とこのプラスミドゲノムを用いてイネの遺伝子が検出できるかを検討した。イネの遺伝子自身のトレーニングデータでは予測確率が低く、アグロバクテリウムで高いものは6個、Tiプラスミドで高いものは21個見つかった。しかしこれら遺伝子の大半はホモログがイネもしくは近縁に限定される、あるいは有効なホモログが無いものであり、水平移行で検出される遺伝子は分子系統解析が困難であることが判明した。また、イネ自身のトレーニングデータでの結果から、下位1%と非常に予測確率が低いものとそうでないものに分類し、更に機能が予測できるもの(他種にホモログがあるもの)とそうでないものに分け、予測された数に差があるかどうかを検定した。その結果、予測確率が低く水平移行の可能性が高い群の方が、ホモログは有意に少ない(フィッシャー「の正確検定でp=1.13x10^-60)ということが判明した。これらの結果から、イネにおいて水平移行と明確に判定できるものは少ない一方、負の自然選択の緩和によって一般的な塩基の偏りから外れ多様化した遺伝子が相当数存在していることを示唆している。
|