2022 Fiscal Year Annual Research Report
新規機械学習法を活用した遺伝的リスクスコアの開発と大腸がんリスク予測モデルの改善
Project/Area Number |
22H03361
|
Research Institution | National Cancer Center Japan |
Principal Investigator |
山地 太樹 国立研究開発法人国立がん研究センター, がん対策研究所, 室長 (10466203)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 大腸がん / 予測モデル / 遺伝的リスクスコア |
Outline of Annual Research Achievements |
本研究の達成目標とするのは、現時点において、日本人の持つ大腸がんの遺伝的リスクを最も反映しているPolygenicリスクスコアを明らかにすることと、Polygenicリスクスコアを取り入れることで、日本人の環境的なリスク要因で構成された大腸がんのリスク予測モデルの予測精度がどの程度改善するかを明らかにすることである。 本研究は、全国11か所の保健所管内に在住する40歳から69歳の地域住民を対象に1990年から追跡調査を行っている「多目的コホート研究」において、既に収集されている疾病罹患前の情報および試料を利用して実施している。「多目的コホート研究」の開発用ゲノムコホートB00で2009年までに把握された大腸がん症例748名、ならびに検証用ゲノムコホートB05で2009年までに把握された大腸がん症例208名については、イルミナ社のSNPマイクロアレイを用いたゲノム網羅的なジェノタイピングが行われている。 3年計画の1年度目にあたる2022年度は、大腸がんを対象にPolygenicリスクスコアの研究開発を行った研究のシステマティックレビューを行った。文献検索は、主にPubMedを用いて行い、Polygenic Score Catalog で過去の研究に漏れが無いか確認した。選択された文献から、Polygenicリスクスコアのアルゴリズムを抽出するとともに、研究のメタデータを記録した。並行して、「多目的コホート研究」の開発用ゲノムコホートB00の追跡期間を2015年まで延長することで新たに把握された大腸がん症例423名の追加タイピングを行った。得られたゲノムデータのクオリティーコントロールを行った後、1000人ゲノムプロジェクトのリファレンスパネルを参照したジェノタイプインピュテーションを実施し、イルミナ社のSNPマイクロアレイには含まれていない遺伝情報の統計学的な推定を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画書に定めた2022年度のマイルストンを概ね達成しているため。
|
Strategy for Future Research Activity |
3年計画の2年度目にあたる2023年度は、Elastic-net cross-validation methodを用いた新たな機械学習により、既存のPolygenicリスクスコアを統合したより精度の高いPolygenicリスクスコアの研究開発を行う。2022年度に抽出した複数のPolygenicリスクスコアを候補とし、同年度中に追加タイピングしたことによって症例数が約1,200名に増えた開発用のゲノムコホートB00 において実施する。候補としたPolygenicリスクスコアが抽出された研究のメタデータを利用して、機械学習のアルゴリズムを改良し、より精度の高いPolygenicリスクスコアの研究開発を目指す。並行して、検証用のゲノムコホートB05の追跡期間を2015年まで延長することで新たに把握された大腸がん症例157名の追加タイピングを行う。得られたゲノムデータのクオリティーコントロールを行った後、1000人ゲノムプロジェクトのリファレンスパネルを参照したジェノタイプインピュテーションを実施し、イルミナ社のSNPマイクロアレイには含まれていない遺伝情報の統計学的な推定を行う。
|
Research Products
(1 results)