研究課題/領域番号 |
22J00780
|
配分区分 | 補助金 |
研究機関 | 国立研究開発法人理化学研究所 |
特別研究員 |
家城 博隆 国立研究開発法人理化学研究所, 生命医科学研究センター, 特別研究員(CPD) (30932834)
|
研究期間 (年度) |
2022-04-22 – 2027-03-31
|
キーワード | 心筋梗塞 / 全ゲノムシークエンス / 胸部X線 |
研究実績の概要 |
虚血性心疾患は全世界の第1位の死因であり大きな問題となっている。遺伝的背景が約50%と推定されておりゲノム研究による遺伝的背景の解明が急務である。過去にはゲノムワイド関連解析(GWAS)が行われ頻度の高い変異・多型(コモンバリアント)の関わりが明らかになり、遺伝的リスクスコア(PRS)による疾患予測も行われるようになってきた。しかしGWASでは統計的検出力が原因でレアバリアントの解析は十分でなくPRSの予測性能も限られているという問題がある。そのため本研究ではバイオバンクジャパンの全ゲノムシークエンスデータに対して機械学習を用いた解析手法を応用することでレアバリアントを解析しより精度の高い遺伝的リスクスコアの作成を目的とした。まず約6000人の全ゲノムシークエンスを機械学習を用いて解析した結果、心筋梗塞の発症に関わることが示唆される遺伝子群を同定した。データのクオリティコントロールと機械学習モデルのパラメータチューニングを行うことでより確度の高い遺伝子群を得た。さらにレアバリアントからなる遺伝的リスクスコアおよびコモンバリアント由来のPRSを算出し検証したところ、それぞれ有意に疾患を予測することが明らかになった。遺伝子群の機能解析として個別の遺伝子の機能や疾患との関連を文献検索し家族性高コレステロール血症の原因遺伝子などが含まれることを確認した。またタンパク質やエピゲノムのデータベースを参照し、遺伝子機能や疾患パスウェイの解析を行なっていくこととした。また今後は得られた遺伝子の解析を進めると同時に、別のゲノムデータを用いた再現性検討も行うこととした。さらには環境因子を組み入れたより精度の高いリスクモデルの構築を目指していく。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
虚血性心疾患発症の遺伝的背景においてはレアバリアントの関連は従来から示唆されていたが統計学的検出力の問題で従来のGWASなどの手法では十分に解析することができなかったが、本研究では従来の手法で十分に検出することができなかったレアバリアントに関して、機械学習におけるスパースモデリング手法を用いた新たなフレームワークで解析することにより、家族性高コレステロール血症に関連する遺伝子が同定されるなど想定された結果が得られている。レアバリアントリスクスコアは従来のGWASの結果から得られるPRSと同様に有意に疾患発症予測が可能であり、組み合わせることによりPRSに対して付加的な結果が得られている。このように人工知能を用いたゲノムおよびレアバリアント解析の重要性を示唆する結果が得られており概ね順調に進行していると考える。
|
今後の研究の推進方策 |
日本人のゲノムデータを用いて解析を行なったが人種により遺伝子型のパターンに違いがあることは知られているため、UKバイオバンクなどのデータで他人種での再現性を確認する解析を行っていく。遺伝子の機能についてタンパク質発現(プロテオーム)のデータなどを活用し機能解析や疾患発症機序の解明を目指していく。また環境要因を取り込んだより精度の高いリスクモデルの構築を目指すため、ウェアラブルデータなど使用可能なデータの探索を行う。
|
備考 |
人工知能を用いて胸部X線から生物学的年齢(X線年齢)を推定するプログラムを開発した。この成果はCommunications Medicine誌に掲載され、X線年齢を推定する プログラムは一般公開した。
|