研究課題/領域番号 |
23K16379
|
研究機関 | 関西医科大学 |
研究代表者 |
眞鍋 翔 関西医科大学, 医学部, 助教 (00794661)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
キーワード | DNA鑑定 / 法遺伝学 / 人工知能 / データベース検索 / 混合資料 |
研究実績の概要 |
本研究の目的は、犯罪現場の遺留DNAに誰のDNAが含まれているかを人工知能(AI)が探索できるようにすることである。令和5年度は、AIの学習に使用する実験データの準備を進めた。 まず、これまでの研究(主に科学研究費課題番号: 20K18981の研究)で取得した約400例の実験データの再解析を行った。これまでの研究では、DNA型検査のシグナルの検出閾値を比較的高めにしていたが、極微量のシグナルも解析対象とするため、バックグラウンドのノイズを拾わない程度まで検出閾値を下げて再解析した。現在、誰のDNAが含まれているかを判断するために必要な指標(特徴量)を得るために必要な情報として、各シグナルの由来(真のアレル、各種アーチファクト)、シグナルの高さ、および何人分のDNAが混合しているかを集計しているところである。 また、新たな実験データの取得のための準備として、DNA型検査に用いる機器のバリデーションを進めた。特に本研究では実際の犯罪捜査を想定して極少量のDNAを扱うため、正確かつ高精度な定量性が要求されることから、リアルタイムPCR法による定量結果の正確性・再現性・感度に関するバリデーションを実施した。その結果、定量結果の正確性・再現性を担保できる最小DNA濃度は約20 pg/μlとなり、十分な検出感度を示した。したがって、十分な定量性の下で新たな実験データを取得できる準備を整えることができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の計画では、新たなデータの取得をもう少し進める予定であった。しかし、諸外国のDNA鑑定実務に携わる法科学者とのディスカッションを通して、DNA型検査に用いる機器、判定基準等のバリデーションの重要性を認識したことから、多少研究の進捗が遅れてでも、バリデーションを詳細に行うことにした。令和5年度は特に、リアルタイムPCR法による定量結果の正確性・再現性・感度に関するバリデーションを実施した。今後は、DNA型検査に用いるPCR、キャピラリー電気泳動装置のバリデーションを実施する必要がある。このため、新たなデータの取得はやや遅れることになるが、当初の計画では令和6年度中に実験データの準備を完了する計画になっており、これには間に合う見込みである。
|
今後の研究の推進方策 |
今年度はDNA型検査に用いるPCR、キャピラリー電気泳動装置のバリデーションを実施した後、実験データの準備を行う。新たに取得するデータは、これまでの研究で取得できていない、DNAを人工的に変性させた試料から得られたプロファイルを中心に取得する。 それと同時に、実験により得られたデータから、AIが誰のDNAが含まれているかを判断するために必要な指標(特徴量)を抽出する作業を進める。その後、AIが学習するためのデータ(訓練データ)と正答率を検証するためのデータ(検証データ)に分け、教師ありの機械学習を行う。アルゴリズムは特徴量のスケールに依存しないランダムフォレスト法を第一候補とし、正答率が悪い場合には、他のアルゴリズムの採用を検討する。学習の際には、どの特徴量が判定に有効かの選択やアルゴリズムの最適なパラメータについても検討する。機械学習には、プログラミング言語Pythonの機械学習ライブラリscikit-learnを用いる。
|
次年度使用額が生じた理由 |
令和5年度に実験のために使用する予定であった一部消耗品は、実験の進捗がやや遅れていることもあり、予定よりも消耗品を購入しなかった。次年度使用額については、再実験時の消耗品か学会発表のための旅費に有効活用したいと考えている。
|