2023 Fiscal Year Annual Research Report
Development of an Explainable Machine Learning Method to Predict Disease Risk from Genotype
Project/Area Number |
22KJ0657
|
Allocation Type | Multi-year Fund |
Research Institution | The University of Tokyo |
Principal Investigator |
太田 力文 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2023-03-08 – 2024-03-31
|
Keywords | 統計遺伝学 / Boosting / 機械学習 / 疾患 |
Outline of Annual Research Achievements |
ゲノムから疾患リスクを非加算モデルの元で予測する機械学習手法の開発を行っている.論文の投稿を完了し,査読の段階にある. 前年度に手法の開発を行ったため,本年度はその手法の評価を幅広く行った.一般の非加法モデルを組み入れた手法の作成は本研究が初めてだったため,本手法の優位性を詳細に解析した.イギリスの大規模ゲノムコホートであるUK Biobankを用いて12の疾患に対して精度評価を行なったところ,いくつかの疾患に対しては本手法が他の手法に比べて高い精度となった.また,非加算モデルを用いた方がより予測精度が高くなる疾患があった. 他にも,シミュレーションで様々な疾患情報を作成し,本手法の精度が高くなるような疾患の特徴を探った.また,本手法で学習を行ったヨーロッパ系の人々以外にも本手法が適用できるかを調べた.非加法効果が大きいバリアントの解析や非加法効果の分布なども解析した.本手法が非加法もできるを含めた疾患関連バリアントを探すためにも有用であることも示した. また,プログラミングコードを改善することで,高速化し,使用メモリも減らした.また,インストールの手順を出来るだけ減らしたり,マニュアルを整備したことで使いやすく改良した.本手法について,予測精度だけではなく様々な角度から評価を行い,コードの最適化も行った.今後も本手法が広く用いられるよう改善していきたい.また幅広い種類のバリアントを取り込めるような手法を作成したい.
|