本研究では、DNA鑑定で検出されるアーチファクトを機械学習の一手法であるランダムフォレスト法により識別できるか検討した。使用するデータは、単一個人のDNA試料(350例)および2人から4人までのDNA混合試料(180例)から得られた全ピーク(43,158個)とした。全ピークの3/4を訓練データ、1/4をテストデータに振り分け、Pythonのライブラリscikit-learnを用いて機械学習を実施したところ、訓練データとテストデータの正解率はそれぞれ100%、約98.9%と非常に高い値が得られた。また、両データの正解率にほぼ差はなく、明らかな過学習は観察されなかった。
|