Artificial intelligence-based genome analysis of coronary artery disease to realize precision health
Project/Area Number |
22K16128
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 53020:Cardiology-related
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
家城 博隆 国立研究開発法人理化学研究所, 生命医科学研究センター, 訪問研究員 (30932834)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2025: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 虚血性心疾患 / ゲノム医療 / 遺伝的リスクスコア / ゲノム / 人工知能 |
Outline of Research at the Start |
虚血性心疾患は全世界の第1位の死因であり大きな問題になっている。過去の双子研究では、虚血性心疾患の発症において遺伝的要因が約50%を占めると報告されていることからも、発症に関わる遺伝的要因を明らかにすることが疾患発症の予測・予防の観点から重要である。 近年のゲノム解析により遺伝的要因は徐々に明らかになってきたが、従来の統計的解析手法の限界が指摘されていることから本研究では従来の解析手法に加えて機械学習によるアプローチにより、遺伝情報を網羅的に解析する。これにより個人レベルで、正確な疾患発症予測と予防の実現を目指す。
|
Outline of Annual Research Achievements |
心筋梗塞や狭心症などの虚血性心疾患は全世界の死因の第一位であり、遺伝的要因と生活習慣などによる環境要因が複雑に絡み合って発症に至る。虚血性心疾患の遺伝的背景明らかにするために申請者はこれまでにゲノムワイド関連解析(GWAS)が行われてきたが、GWASでは統計学的検出力などが原因でレアバリアント(頻度の低い多型・変異)を十分に解析することができなかった。またGWASの統計値から算出される遺伝的リスクスコア(PRS)の性能も十分でなかった。そのため本研究では虚血性心疾患の発症におけるレアバリアントの役割を明らかにするために、新たな人工知能を用いたモデルを用いて解析し新たな遺伝的リスクスコアを作成することを目的とした。 心筋梗塞患者と非心筋梗塞患者の約6000人の全ゲノムシークエンスに対して人工知能を用いたモデルを訓練することで虚血性心疾患に関連する59個の遺伝子群を同定した。この遺伝子群の機能を調べるために、遺伝子の注釈付け(アノテーション)およびクラスタリングを用いた手法によりこれらの遺伝子を8個のクラスターに分類した。人およびマウスの表現型に関連している遺伝子が多く得られた。またSTRINGのデータベースを用いてタンパク質の相互作用ネットワークにこれらの遺伝子を当てはめることにより46個の疾患に関連する機能モジュールを得た。これらのモジュールの機能を推定することにより脂質や免疫、血管形成などが虚血性疾患に関連していることが示唆された。また人工知能モデルからレアバリアントを用いた遺伝的リスクスコアを作成し独立したデータで性能を検証し有意に疾患予測が可能であることを確認した。レアバリアントを用いた遺伝的リスクスコアは脂質や凝固機能などのいくつかの臨床パラメータと相関していた。引き続き遺伝子の機能推定や遺伝的リスクスコアの検証を進める。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまでに人工知能を用いたモデルを用いて約6000人の全ゲノムシークエンスのデータの解析を行い、交差検証方法を用いてモデルのパラメータチューニングを行うことで約59の遺伝子を同定した。この59の遺伝子の機能を探索するために、Human Phenotype OntologyやGene Ongotologyのデータを用いた遺伝子セットエンリッチメント解析を行うことで機能を推定した。またこれに加えて過去のGWASやエンハンサー情報などのデータベースを参照して注釈付け(アノテーション)を行ってこれをもとにクラスタリング解析を行うことで遺伝子群のクラスター分類まで行った。さらにタンパク質間相互作用(PPI)ネットワークデータに対して遺伝子群を当てはめることにより遺伝子群の機能モジュールを推定した。 このように同定した遺伝子群について様々なデータベースや機械学習手法を用いて機能推定を行い、またPPIやエンハンサー情報などのオミックス情報を組み合わせることにより疾患パスウェイの推定を行うことができているという点で順調に進行している。 また人工知能モデルを用いた遺伝的リスクスコアについても臨床パラメータや夜ごとの関連についての検証が進んでおり順調に進行していると考える。
|
Strategy for Future Research Activity |
これまでに得られた結果の他人種での再現性を確認するためにUKバイオバンクのデータ解析を進める。エクソームシークエンスデータを用いた解析では日本人のデータでの結果とやや異なっていた。新たに公開されたUKバイオバンクの全ゲノムシークエンス情報を参照し再現性について改めて検討する。また得られた遺伝子群の機能解析やパスウェイ解析を更に進めることにより虚血性心疾患の発症機序を明らかにしていく。
|
Report
(2 results)
Research Products
(4 results)