Project/Area Number |
23K16379
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 58040:Forensics medicine-related
|
Research Institution | Kansai Medical University |
Principal Investigator |
眞鍋 翔 関西医科大学, 医学部, 助教 (00794661)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2024: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2023: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
Keywords | DNA鑑定 / 法遺伝学 / 人工知能 / データベース検索 / 混合資料 / 法医学 / データベース |
Outline of Research at the Start |
DNA鑑定実務では、犯罪現場に残されたDNAの質が悪く複数人のDNAが混合している場合に、誰のDNAが含まれているかを評価することが求められる。特に、捜査情報が殆どなく、問題となる人物(事件の被疑者など)が特定できない場合には、DNA型データベースに登録されている個人の中から、問題となる人物を探索する必要がある。本研究では、犯罪現場の遺留DNAに誰のDNAが含まれているかを人の手を介さずに短時間で探索できるようにすることを目的とする。具体的には、多数の実験データを基に機械学習を行うというAIの技術を応用し、判定精度については既存の専用ソフトウェアを用いて精査する。
|
Outline of Annual Research Achievements |
本研究の目的は、犯罪現場の遺留DNAに誰のDNAが含まれているかを人工知能(AI)が探索できるようにすることである。令和5年度は、AIの学習に使用する実験データの準備を進めた。 まず、これまでの研究(主に科学研究費課題番号: 20K18981の研究)で取得した約400例の実験データの再解析を行った。これまでの研究では、DNA型検査のシグナルの検出閾値を比較的高めにしていたが、極微量のシグナルも解析対象とするため、バックグラウンドのノイズを拾わない程度まで検出閾値を下げて再解析した。現在、誰のDNAが含まれているかを判断するために必要な指標(特徴量)を得るために必要な情報として、各シグナルの由来(真のアレル、各種アーチファクト)、シグナルの高さ、および何人分のDNAが混合しているかを集計しているところである。 また、新たな実験データの取得のための準備として、DNA型検査に用いる機器のバリデーションを進めた。特に本研究では実際の犯罪捜査を想定して極少量のDNAを扱うため、正確かつ高精度な定量性が要求されることから、リアルタイムPCR法による定量結果の正確性・再現性・感度に関するバリデーションを実施した。その結果、定量結果の正確性・再現性を担保できる最小DNA濃度は約20 pg/μlとなり、十分な検出感度を示した。したがって、十分な定量性の下で新たな実験データを取得できる準備を整えることができた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初の計画では、新たなデータの取得をもう少し進める予定であった。しかし、諸外国のDNA鑑定実務に携わる法科学者とのディスカッションを通して、DNA型検査に用いる機器、判定基準等のバリデーションの重要性を認識したことから、多少研究の進捗が遅れてでも、バリデーションを詳細に行うことにした。令和5年度は特に、リアルタイムPCR法による定量結果の正確性・再現性・感度に関するバリデーションを実施した。今後は、DNA型検査に用いるPCR、キャピラリー電気泳動装置のバリデーションを実施する必要がある。このため、新たなデータの取得はやや遅れることになるが、当初の計画では令和6年度中に実験データの準備を完了する計画になっており、これには間に合う見込みである。
|
Strategy for Future Research Activity |
今年度はDNA型検査に用いるPCR、キャピラリー電気泳動装置のバリデーションを実施した後、実験データの準備を行う。新たに取得するデータは、これまでの研究で取得できていない、DNAを人工的に変性させた試料から得られたプロファイルを中心に取得する。 それと同時に、実験により得られたデータから、AIが誰のDNAが含まれているかを判断するために必要な指標(特徴量)を抽出する作業を進める。その後、AIが学習するためのデータ(訓練データ)と正答率を検証するためのデータ(検証データ)に分け、教師ありの機械学習を行う。アルゴリズムは特徴量のスケールに依存しないランダムフォレスト法を第一候補とし、正答率が悪い場合には、他のアルゴリズムの採用を検討する。学習の際には、どの特徴量が判定に有効かの選択やアルゴリズムの最適なパラメータについても検討する。機械学習には、プログラミング言語Pythonの機械学習ライブラリscikit-learnを用いる。
|