研究課題
2020年度は1.トレーニングデータを用いた2型糖尿病感受性遺伝子変異の選定、2.各種既存アルゴリズムを適用した2型糖尿病発症リスクの層別化、3.新規機械学習アルゴリズムの開発によるリスク層別化の精度向上、の3つの課題を実施した。1.については、バイオバンクジャパン 20万人(うち糖尿病4万人、非糖尿病16万人)のデータを活用し、ゲノムワイド関連解析(GWAS)を実施し、2型糖尿病に関連する遺伝子変異を選択した。2.については、1.で同定した2型糖尿病感受性遺伝子変異に関するジェノタイプデータを用いてバイオバンク・ジャパンのサンプルにおいてゲノムデータの主成分(PCA)による次元縮約やポリジェニック・リスク・スコア(PRS)によるリスク層別化を実施した。既存の高次元圧縮技術などのアルゴリズムが抱えている問題点を克服するため、高次元圧縮技術の組み合わせ(PCA-UMAP)を適用し、2型糖尿病のリスク層別化の精度を向上させた。さらに、分子生物学的経路(以下、パスウェイ)のデータベースからパスウェイ情報を網羅的に取得し、各パスウェイに属する遺伝子が存在するゲノム領域のSNPに限定してポリジェニック・リスク・スコアを計算した(パスウェイPRS)。パスウェイPRS同士の相関係数を算出し、相関が強いパスウェイ同士を同一のクラスターに所属させるクラスタリングを実施し、パスウェイのクラスターごとにPRSを算出した。パスウェイ・クラスターPRSを代謝疾患に関わる形質との関連に基づき特徴付を行った。パスウェイ・クラスターPRSの算出により、同一のPRSを有する被検者であっても、そのパスウェイ・クラスターPRSの分布は異なることが明らかとなった。これらの知見により、同等の2型糖尿病発症リスクを有する被検者であっても、パスウェイ・クラスターPRSに基づきその病型の評価が可能となることが期待される。
すべて 2020 その他
すべて 国際共同研究 (5件) 雑誌論文 (7件) (うち国際共著 3件、 査読あり 7件、 オープンアクセス 2件)
Molecular Biology and Evolution
巻: 37 ページ: 1306-1316
10.1093/molbev/msaa005
Nature Communications
巻: 11 ページ: 1569
10.1038/s41467-020-15194-z
巻: 11 ページ: 3175
10.1038/s41467-020-16711-w
Nature Genetics
巻: 52 ページ: 669-679
10.1038/s41588-020-0640-3
Nature
巻: 582 ページ: 240-245
10.1038/s41586-020-2263-3
Diabetes Research and Clinical Practice
巻: - ページ: 108461
10.1016/j.diabres.2020.108461
International Immunology
巻: - ページ: -
10.1093/intimm/dxaa059