2022 Fiscal Year Annual Research Report
Development of an Explainable Machine Learning Method to Predict Disease Risk from Genotype
Project/Area Number |
21J21867
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
太田 力文 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2021-04-28 – 2024-03-31
|
Keywords | ゲノム / リスクスコア / 疾患リスク / 機械学習 / ビッグデータ |
Outline of Annual Research Achievements |
ゲノムから疾患リスクを説明可能な形で予測する機械学習手法の開発を行っている.現在,手法の開発が完了したため,論文執筆中である. 当初の予定では,従来から提案されてきたものと同じモデルを用いる予定だったが,今回開発したものは,従来のモデルでは捉えられないような遺伝的な効果を捉えることに成功した.これにより,予測精度を上げるだけでなく,疾患の解釈も行うことができた.このような従来捉えられないような効果を捉えるようなリスク予測手法はこれまで提案されたことがなく,新しい貢献となる.従来から用いられてきたような統計学に基づく方法ではなく,機械学習手法をもとに作成したことが新しいモデルを提案できた大きな要因だと考えている. 開発した新規手法により,疾患ごとに適したモデルを考慮することで精度向上が期待でき,疾患ごとの特徴も解釈できることがわかった.この結果は先行研究とも合致しており,新規手法の妥当性を示せたと考えている.今後も他の疾患に適用することで新しく疾患の解釈ができることを期待してる. また,非常に大きい入力データサイズに対処するため,プログラミング実装を工夫し,実行可能な時間まで縮めることができた. これらの研究成果を国際学会で口頭発表することができた. このように研究申請時には想定していなかった新しいモデルや手法を開発することができた.これまでに得た知見を元に今後の研究を加速させたいと考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
最初に手法の開発が完了したのは昨年度だったが,さらに精度を上げ,かつ新しい解釈ができるような手法を作成していたため,論文は今年度の投稿予定である.新しく開発を行ったことで,既存手法では見つからないようなバリアントを選ぶことができた.また,それらのバリアントは医学的にも重要なものであることがわかり,手法の妥当性を確認できた.
|
Strategy for Future Research Activity |
研究計画にある通り,今後はバリアントの相互作用を考慮できるような手法の開発や,Whole Exome Sequenceのデータを入力とする手法の開発を行いたい.どちらも既存の機械学習手法や自分の開発した手法を直接適用するだけでは良い精度は得られないと考えているため,これまでの知見を活かして新しい手法の開発を行う予定である.また,論文の投稿,国際学会での発表を行う予定である.さらに,統計遺伝学を牽引している海外の研究室へ渡航し,共同研究を行いたいと考えている.
|