調査回数を増やすため、調査地を鹿児島県花渡川から和歌山県富田川水系高瀬川に変更し、2017年7月、2017年10月に環境DNAの濾過採集を行った。また、採集した環境DNAからニホンウナギのターゲット領域を増幅し、網羅的な解読を行うことで、地点間のハプロタイプ数の評価を試みた。このデータでは、高スループットシーケンサによる読み間違いの影響が見られた。読み間違い率は1回のシーケンサの稼働で解読したサンプル間では大きく変わらないはずだが、サンプル間で得られた配列数は大きく異なるため、多くの配列が得られたサンプルでは、読み間違いも多くなり、見かけ上のハプロタイプ数が増す。配列数を無作為に間引くことで配列数をサンプル間で均質化を行っても、サンプル内に含まれるハプロタイプが多いサンプルと少ないサンプルでは、1ハプロタイプ当たりの配列数(カバレッジ深度)は異なってしまうと考えられる。カバレッジ深度が異なると、やはり見かけ上のハプロタイプ数に影響すると考えられる。この問題を解決するため、当初計画にはなかったが、新たに読み間違いと思われる配列を検出して除去する手法を開発した。これにより、読み間違い率の異なる、複数回のシーケンサの稼働によって取得したデータにおいても正確なハプロタイプ数が推定できるようになった。
|