本研究課題の目的は、生活習慣や健康診断情報などの様々な健康医療データと全ゲノム情報と非相加的に組み合わせて、両者の相互作用を考慮し、高精度なリスク予測モデルを構築する手法を開発することである。 前年度までに、これまで開発したスパースモデリング手法STMGP(smooth-threshold multivariate genetic prediction)を用いて、全ゲノムデータと性別や年齢等の背景因子を組み合わせたリスク予測モデリング、うつ症状に対するリスク予測モデルの精度評価、シミュレーション研究および実際のデータに対する検証を行い、本手法の有用性を示した。さらに、STMGP法を拡張し、全ゲノムデータと性別や年齢等の背景因子、さらにはそれらの相互作用(遺伝子×環境相互作用)をモデルに組み込んだリスク予測モデリング手法を開発した。令和4年度は、前年度までに培った予測モデル開発の経験をもとに、新型コロナウイルス感染症の感染者数の時空間データから時空間データモデリングを行うための非線形ランダム効果とベータ負の二項分布を用いた新たな手法を開発し、学術雑誌に論文として発表した。また、得られた成果を国内学会で報告した。一方、機械学習手法を含む様々な疾患予測モデルの実データでの比較検証を行うために、生活習慣等の情報を含む様々な種類の健康医療データに適用して予測精度を評価する研究を行い、得られた結果を国際シンポジウムで報告した。
|