前年度に完成した遺伝子×遺伝子ならびに遺伝子×環境相互作用のための高次元変数選択法ソフトウェアについて、実際のゲノムコホートデータをテストデータとして適用し、この手法の妥当性を検証した。 具体的には、これまで作成してきた疎性モデリングのアルゴリズムを実装したソフトウェアプログラムを用いて、宮城県住民を対象とした東北メディカル・メガバンク機構の前向きゲノムコホートで取得されていた環境暴露データについて、各変数のコーディングを行った。次に、この前向きゲノムコホートで取得されていた100万程度のSNPsのジェノタイプデータを取り込みを行った。特に、SNPのクラスタリングエラーが相互作用検索時に深刻な偽陽性を生むことが知られているため、各SNPのクラスタリングに関するQCデータを利用し、低いクオリティのデータを事前に排除した。上記のデータをテストデータとして高次元変数選択法ソフトウェアにかけ、横断的な健康診断データを応答変数にして横断的解析を行い、次に、疾患二値データや前向きデータへの適用を試みた。さらに、うつ傾向スコア(CES-D)に適用して、ゲノムリスク予測を実施した。その結果、現在主流となっているPRS(ポリジェニックリスクスコア)の推定法であるP+Tなどの既存手法よりも高い予測性能を達成した。 このことは、ゲノムコホートからの精神健康状態に関するマルチスケールデータへ適用によって、遺伝子×遺伝子ならびに遺伝子×環境相互作用の解析が実行可能となり、リスク予測に有用である可能性を示している。この成果について、国際専門誌に論文発表を行った。
|