2023 Fiscal Year Annual Research Report
新規機械学習法を活用した遺伝的リスクスコアの開発と大腸がんリスク予測モデルの改善
Project/Area Number |
22H03361
|
Allocation Type | Single-year Grants |
Research Institution | National Cancer Center Japan |
Principal Investigator |
山地 太樹 国立研究開発法人国立がん研究センター, がん対策研究所, 室長 (10466203)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 大腸がん / 予測モデル / 遺伝的リスクスコア |
Outline of Annual Research Achievements |
本研究は、全国11か所の保健所管内に在住する40歳から69歳の地域住民を対象に1990年から追跡調査を行っている「多目的コホート研究」において、既に収集されている疾病罹患前の情報および試料を利用して実施している。「多目的コホート研究」の開発用ゲノムコホートB00で2009年までに把握された大腸がん症例748名、ならびに検証用ゲノムコホートB05で2009年までに把握された大腸がん症例208名については、イルミナ社のSNPマイクロアレイを用いたゲノム網羅的なジェノタイピングが行われている。 3年計画の2年度目にあたる2023年度は、Elastic-net cross-validation methodを用いた新たな機械学習により、既存のPolygenicリスクスコアを統合したより精度の高いPolygenicリスクスコアの研究開発を目指した。2022年度に抽出したPolygenicリスクスコアを候補とし、追加タイピングで症例数が1,171名に増えた開発用のゲノムコホートB00 において実施した。候補としたPolygenicリスクスコアが抽出された研究のメタデータを利用して、機械学習のアルゴリズムを改良し、より精度の高いPolygenicリスクスコアの研究開発を目指したが、期待した成果が得られなかった。並行して、ゲノムコホートB05の追跡期間を延長することで新たに把握された大腸がん症例157名の追加タイピングを行った。得られたゲノムデータのクオリティーコントロールを行った後、1000人ゲノムプロジェクトのリファレンスパネルを参照したジェノタイプインピュテーションを実施し、イルミナ社のSNPマイクロアレイには含まれていない遺伝情報の統計学的な推定を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
Elastic-net cross-validation methodを用いた新たな機械学習により開発されたPolygenicリスクスコアが、期待した精度を示さなかったため。
|
Strategy for Future Research Activity |
Elastic-net cross-validation methodを用いた新たな機械学習により研究開発したPolygenicリスクスコアに加えて、もととなった既存のPolygenicリスクスコアの検証を、症例数が365名に増えた検証用のゲノムコホートB05において実施する。最善の検証結果が得られたPolygenicリスクスコアを、日本人の環境的なリスク要因で構成された大腸がんのリスク予測モデルに取り入れて、予測精度の改善を評価する。
|