2021 Fiscal Year Research-status Report
DNA鑑定実務に資する人工知能によるアーチファクト自動判定ツールの開発
Project/Area Number |
20K18981
|
Research Institution | Kansai Medical University |
Principal Investigator |
眞鍋 翔 関西医科大学, 医学部, 助教 (00794661)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | DNA鑑定 / 法医学 / 人工知能 / アーチファクト / 混合試料 |
Outline of Annual Research Achievements |
本研究の最終目標は、DNA鑑定で検出されるアーチファクトを人工知能(AI)に判断させるツールを構築することである。令和3年度はまず、単一個人のDNA試料(350例)、2人から4人までのDNAを混合した試料(180例)について、マイクロサテライト21か所のDNA型データを取得した。それぞれのDNA型データにおいて検出された各シグナルについては、既知のDNA型情報を基に、アレルまたはアーチファクト(back stutter、forward stutter、double-back stutter、minus 2-nt stutter、pull-up、unknownのいずれか)に分類してラベル化した。 続いて、各シグナルを判別するための機械学習を試みた。令和3年度は単一個人のDNA試料(350例)のみに着目し、245例を訓練データ、105例を検証データとした。各シグナルを判別するための指標(特徴量)として、ターゲットとなるシグナルが検出された位置とシグナルの強さ(ピーク高)、及びターゲットとなるシグナルの±8塩基の範囲にある全シグナルのピーク高を選択した。また、機械学習のアルゴリズムは、特徴量の正規化・標準化が不要なランダムフォレストを選択した。その結果、訓練データにおける正答率は99.4%と十分に高い値を示した。また、検証データにおける正答率も訓練データの場合と同等の99.4%となり、過学習を起こしているとは考えにくい結果が得られた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和3年度は、令和2年度に実施予定であった実験データの準備に加え、シグナルを判別するための機械学習を試みることができた。機械学習については、適切なアルゴリズムや特徴量の選択をこれから詳細に行う必要はあるが、令和3年度に試みた方法でも十分に高い正答率が得られた。また、令和2年度の時点では、アーチファクトのうちpull-upのみに焦点を絞ることを考えていたが、pull-up以外のアーチファクトについても高い正答率であったため、特にpull-upのみに絞らなくても問題なくなった。このことから、アーチファクトを人工知能(AI)に判断させるツールの基礎はある程度構築できたと感じている。よって、現在までの進捗状況としては、おおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
令和4年度はまず、適切なアルゴリズムや特徴量の選択を詳細に行う。令和3年度に試みたアルゴリズム(ランダムフォレスト)、特徴量の条件でも十分に高い正答率を示したが、より良いアルゴリズムがないか、シグナルの判別にそれほど有用ではない特徴量が混じっていないか等を検討する。次に、2人から4人までのDNAを混合した試料(180例)におけるシグナルについても高精度で判定できるか検討する。正答率が低い場合には、アルゴリズムや特徴量の見直しを行い、混合試料においても高い正答率が得られるように改良する。機械学習の条件が固まれば、プログラミング言語のPythonまたはRを用い、シグナルを判定するためのツールを構築する。 最後に、構築したツールの判定が実際のDNA鑑定実務における混合試料の解析に与える影響について調査する。各混合試料について、構築したツールでアーチファクトと判定されたシグナルを除去した上で、これまでに申請者が開発したソフトウェア(Kongoh)で解析を行い、「試料中に何人のDNAが含まれているか」、「誰のDNAが含まれているか」をどの程度正しく判定できるかを調査する。
|
Causes of Carryover |
令和3年度に実験のために使用したチューブ、チップ等の一部消耗品には、研究室の他の構成員と共同で使用する場合もあるため、当該科研費の直接経費以外にも大学から各研究室に割り当てられる費用で賄うことが可能である。このため、令和3年度中に全額を無理に使用する必要はなくなった。次年度使用額については、再実験時の消耗品か学会発表のための旅費に有効活用したいと考えている。
|
Research Products
(3 results)