研究実績の概要 |
多くの生物は広がりを持った空間に生息し、その距離に応じて交流を保ちつつも遺伝的多様性を保持している。集団遺伝学的解析では、この本来は連続的に分布している生物集団を離散的な集団の組み合わせに近似して解析しているが、そのためには本来の集団の状況を適切に把握しなければならない。本研究では理論やシミュレーションを用いて、集団の状況を適切に把握するための研究を遂行した。特に近年は全ゲノムSNPデータを用いた解析が多いが、これらSNPデータはその取得方法に気をつけなければバイアスを含む可能性がある。そこで、タイピング法を用いて作成されたSNPデータはどの程度正確に元の集団の情報を反映しているのか、バイアスを含んだデータを使って解析した場合どの程度歪んだ結果を導くのか、バイアスのない解析を行うためにはどのような方法が望ましいのか、という点について研究を進めた。一連のシミュレーションの結果、タイピングデータは不可避的に情報が歪むことを明確にした。さらにタイピングデータを用いて集団構造の解析を行うと、そのデータの作成プロセスに応じて歪んだ構造推定が行われることが明らかとなった。これらのひずみはデータ作成プロセスに注意を払うことで、影響を小さく抑えることができる。具体的には、サンプルは得手集団に集中させず、かつマーカーは全集団の多様性情報を総合して作成する。これらの結果は論文に取りまとめて発表した(Dokan et al. G3, 2021)。 さらに集団構造の把握は、その時に用いる統計量にも影響する。Fstは集団遺伝学で広く用いられてきた量だが、その具体的計算方法は複数存在する。これらの量はそれぞれ特性が異なり、得られる分化程度が異なるため、解析時には個々の統計量の実装に留意する必要がある。この結果は論文に取りまとめ投稿予定である
|