2023 Fiscal Year Research-status Report
Multi-omics data analysis using machine learning for precision medicine in coronary artery disease
Project/Area Number |
22KJ3142
|
Allocation Type | Multi-year Fund |
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
家城 博隆 国立研究開発法人理化学研究所, 生命医科学研究センター, 特別研究員(CPD)
|
Project Period (FY) |
2023-03-08 – 2027-03-31
|
Keywords | 心筋梗塞 / 機械学習 |
Outline of Annual Research Achievements |
心筋梗塞や狭心症などの虚血性心疾患は全世界の第1位の死因であり患者だけでなく医療経済の観点から大きな問題となっている。虚血性心疾患のゲノム医療において多くのゲノムワイド関連解析が行われ頻度の高い変異・多型(コモンバリアント)の関わりが明らかになり、遺伝的リスクスコア(PRS)による疾患予測も行われるようになってきた。しかしレアバリアントの解析は十分でなく遺伝的リスクスコアの予測性能も限られているという問題がある。また環境因子が十分に解析されていない。そのため本研究ではバイオバンクジャパンの全ゲノムシークエンスデータに対して機械学習を用いた解析手法を応用することでレアバリアントを解析しより精度の高い遺伝的リスクスコアの作成を目指した。 約6000人の全ゲノムシークエンスを解析した結果、約60個の遺伝子が心筋梗塞の発症に関わることが示唆された。この遺伝子群に対してタンパク質間相互作用(PPI)ネットワークの情報を重ね合わせることで疾患に関わるモジュールとして免疫や脂質に関するものが同定され、またエンリッチメント解析によりいくつかの疾患のパスウェイが同定された。またレアバリアントからなる遺伝的リスクスコアを作成し、クロスバリデーション解析および独立したデータで検証したところ有意に疾患を予測することが明らかになった。レアバリアント遺伝的リスクスコアと血液 検査やバイタルサインなどの臨床パラメータを比較すると脂質や凝固機能が有意に関連していることが明らかになり、心筋梗塞の予後にも関連が見られた。またウェアラブルデバイスによるデータを組み入れるため、米国のデータベースなどにアクセスし有用性を検討した。今後は得られた遺伝子の解析を進めると同時に、環境因子を組み入れたより精度の高いリスクモデルの構築を目指していく。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
機械学習を用いた解析により遺伝子の同定や遺伝的リスクスコアの作成を行い、さらに遺伝子や疾患パスウェイの解析などを実施した。また遺伝的リスクスコアと臨床パラメータの相関についての結果も得られてきておりレアバリアントの網羅的解析とリスクモデル構築が進んでいる。環境因子についてはウェアラブルデバイスのデータを収集するため公共データベースへのアクセスを申請しデータの確認を進めている。このように得られた遺伝子についてダウンストリーム解析や、リスクスコア作成と臨床情報との関連の解析、ウェアラブルデータへのアクセスなどを行なっており、概ね順調に進んでいると考えられる。
|
Strategy for Future Research Activity |
今後は機械学習を用いたレアバリアント解析の手法について、使用するバリアントタイプ(ミスセンスやナンセンス、フレームシフト変異など)の検討やモデルの手法について、さらに検討を進めて精度の向上を目指す。また非遺伝的要因を取り込んだモデルについてもオミックスデータやウェアラブルなどの公共データベースを用いて検討を進めていく。
|
Causes of Carryover |
研究成果の学会発表や論文投稿を予定していたが、研究結果を更に進めてから学会発表及び投稿を行う方針としたため、学会参加の旅費や学会費および論文投稿費などを使用しなかった。来年度には結果がまとまる予定のため、学会発表の旅費および論文投稿費用などに使用する予定とした。
|