研究課題/領域番号 |
23K18152
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分45:個体レベルから集団レベルの生物学と人類学およびその関連分野
|
研究機関 | 琉球大学 |
研究代表者 |
佐藤 丈寛 琉球大学, 医学(系)研究科(研究院), 准教授 (10558026)
|
研究期間 (年度) |
2023-06-30 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2023年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
|
キーワード | 古代ゲノム / 集団遺伝学 / 古人骨 / 次世代シーケンシング / 低カバレッジ |
研究開始時の研究の概要 |
本研究課題では、古人骨由来の低カバレッジゲノムデータにおける参照バイアスが、集団遺伝学的解析にどのような影響を及ぼすのかについて検討する。現代人の高カバレッジゲノムデータや、中~高カバレッジ古代人ゲノムデータに対して、リード長短縮とダウンサンプリングによる低カバレッジデータのシミュレートを行い、オリジナルデータと解析結果を比較する。さらに、中~高カバレッジでシーケンスできた古代人DNA試料をあえて極度の低カバレッジでシーケンスをするなどのプロセスを経て生成されたデータでも比較検討を行い、低カバレッジ古代ゲノムデータに適用可能な解析を明確化することで新たなパレオゲノミクス解析指針の確立を目指す。
|
研究実績の概要 |
これまでに古代ゲノム解析でよく使用されているマッピングアルゴリズムであるBWA alnと現代人ゲノムデータ解析に一般的に使用されているBWA memの両者を古代ゲノム解析に適用した際に、どちらの方が参照バイアスが強くなるのか検討した。古代ゲノム解析に推奨されてきたaln -l 1,024 -n 0.03を使用したマッピングでは、デフォルトセッティングのBWA memに対し、ゲノム参照配列にマッピングされるリード数は僅かに多かった。しかし、alnではリード長が短くなるほどreference alleleの載ったリードの方がalternative alleleの載ったリードよりもマッピングされやすい傾向があったのに対し、memでは、両者のマッピング比率はリード長にかかわらずほぼ一定であった。マッピングアルゴリズムの違いがpseudo-haplotypeコール後のデータに与える影響を検証するために、D(Chimp,hg19ref,mem,aln)を計算したところ、 解析に使用した16個体の古人骨ゲノム中8個体では、alnを使用したデータとゲノム参照配列との親和性が有意に高かった。残りの8個体については有意差がみられなかったが、そのうち7個体については、やはりalnを使用したデータの方がゲノム参照配列との親和性が高い傾向にあった。また、有意差がみられなかった個体のゲノムカバレッジはすべて0.5×未満であり、ある程度以上のカバレッジが得られているデータでは常にalnを使用した方が参照バイアスが強くなることが示唆された。このことは、古代人ゲノムと現代人ゲノムの比較解析にも影響を及ぼすものと考えられる。これまでに報告されてきた古代人と現代人の遺伝的特徴の差異のいくつかは、単に使用したマッピングアルゴリズムの違いに起因しているかもしれず、再検討が必要であると考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
他研究機関への異動とその後の解析環境構築に時間がかかり、研究計画の一部を遂行できなかった。
|
今後の研究の推進方策 |
異なるマッピングアルゴリズムを使用して生成した、古人骨由来のpseudo-haplotypeデータが集団遺伝学的解析においてどのような挙動の違いを示すのかを検証する。検討する解析手法は、主成分分析、ADMIXTURE解析、TreeMix解析、outgroup f3 test、D test, qpAdmモデリング、qpGraphモデリングといった、古代ゲノム論文で広く使用されているものを対象とする。特に、D testについては、D(Chimp,hg19ref,mem,aln)において有意差のある結果が観察されていることから、一般的な集団遺伝学的解析で行われるようなD testにおいても、alnを使ったデータとmemを使ったデータには差異が生じる可能性が考えられる。また、同様にf統計量をベースとしたqpAdmモデリングやqpGraphモデリングにおいても差異が観察される可能性が期待できるため、特にこれらの解析に注目して検証を進める。
|