研究課題/領域番号 |
22K16128
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分53020:循環器内科学関連
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
家城 博隆 国立研究開発法人理化学研究所, 生命医科学研究センター, 訪問研究員 (30932834)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2025年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 虚血性心疾患 / ゲノム / 人工知能 |
研究開始時の研究の概要 |
虚血性心疾患は全世界の第1位の死因であり大きな問題になっている。過去の双子研究では、虚血性心疾患の発症において遺伝的要因が約50%を占めると報告されていることからも、発症に関わる遺伝的要因を明らかにすることが疾患発症の予測・予防の観点から重要である。 近年のゲノム解析により遺伝的要因は徐々に明らかになってきたが、従来の統計的解析手法の限界が指摘されていることから本研究では従来の解析手法に加えて機械学習によるアプローチにより、遺伝情報を網羅的に解析する。これにより個人レベルで、正確な疾患発症予測と予防の実現を目指す。
|
研究実績の概要 |
心筋梗塞などの虚血性心疾患は全世界の死因の第1位であり全世界的に大きな問題となっている。虚血性心疾患は生まれつきの遺伝的要因と生活習慣などによる環境要因が複雑に絡み合って発症に至ることが知られている。虚血性心疾患に関わる遺伝的背景を明らかにするために申請者はこれまでにゲノムワイド関連解析(GWAS)により新規の遺伝的座位を同定してきた。しかし統計学的な検出力の問題でレアバリアント(頻度の低い多型・変異)を十分に解析することができなかった。 本研究ではGWASでは十分に検出することができない特にレアバリアントの役割を明らかにするために、心筋梗塞患者と非心筋梗塞患者の約6000人の全ゲノムシークエンスのデータを人工知能を用いたモデルで解析した。全ゲノムシークエンスデータからレアバリアントを抽出し疾患発症の有無を推定する機械学習モデルを構築し、学習モデルのパラメータ解析を行う事により心筋梗塞発症に関連が示唆されるレアバリアントを含む遺伝子群を同定した。同定した遺伝子群には家族性高コレステロール血症の原因遺伝子などが含まれていることを確認しモデルの妥当性が示唆された。 続いて機械学習モデルからレアバリアント遺伝的リスクスコアを作成した。バイオバンクジャパンのSNPジェノタイピングアレイデータを用いてGWASを行いコモンバリアントからなる多遺伝子リスクスコア(PRS)を作成した。これらを独立したコホートで検証したところ遺伝的リスクスコアから有意に疾患発症予測が行えること明らかにした。 また人工知能(ディープラーニング)を用いて、胸部X線画像から生物学的年齢を推定するプログラムを開発し推定年齢(X線年齢)が心疾患の予後に関連することを明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
虚血性心疾患発症の遺伝的背景においてはレアバリアントの関連は従来から示唆されていたが統計学的検出力の問題で従来のGWASなどの手法では十分に解析することができなかった。本研究では従来の手法で十分に検出することができなかったレアバリアントに関して、人工知能を用いたアプローチで解析を行った。機械学習におけるスパースモデリングという手法を用いた新たなフレームワークでゲノムデータを解析することにより、脂質に関連する遺伝子が同定されるなど想定された結果が得られている。また人工知能を用いた疾患発症予測モデル(リスクスコア)は従来のGWASの結果から得られるPRSと同様に有意に疾患発症予測が可能であり、PRSと足し合わせることによりPRSに対して付加的な結果が得られている。 このように人工知能を用いたゲノムおよびレアバリアント解析の重要性を示唆する結果が得られており概ね順調に進行していると考える。
|
今後の研究の推進方策 |
ここまでは日本人のゲノムデータを用いて行った解析であるが、人種により遺伝子型のパターンに違いがあることは知られている。そのためこれまでに得られた結果の他人種での再現性を確認するためにUKバイオバンクのデータ解析を行っていく。ゲノムデータだけでなく遺伝子発現(トランスクリプトーム)やタンパク質発現(プロテオーム)のデータを用いてゲノム解析から得られた遺伝子の機能解析を行うことにより虚血性心疾患の発症機序を明らかにしていく。
|