研究課題/領域番号 |
22H03361
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分58030:衛生学および公衆衛生学分野関連:実験系を含まない
|
研究機関 | 国立研究開発法人国立がん研究センター |
研究代表者 |
山地 太樹 国立研究開発法人国立がん研究センター, がん対策研究所, 室長 (10466203)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,940千円 (直接経費: 13,800千円、間接経費: 4,140千円)
2023年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 11,830千円 (直接経費: 9,100千円、間接経費: 2,730千円)
|
キーワード | 大腸がん / 予測モデル / 遺伝的リスクスコア / 機械学習 |
研究開始時の研究の概要 |
本研究は、全国11か所の保健所管内に在住する40歳から69歳の地域住民を対象に1990年から追跡調査を行っている多目的コホート研究において、既に収集されている疾病罹患前の情報および試料を利用して実施される。本研究の学術的独自性は、日本人の持つ大腸がんの遺伝的リスクを最も反映しているPolygenicリスクスコアを明らかにするに当たり、既存のPolygenicリスクスコアを単に検証するだけでなく、新たな機械学習の方法である Elastic-net cross-validation method を応用した、より精度の高いPolygenicリスクスコアの研究開発を試みることである。
|
研究実績の概要 |
本研究の達成目標とするのは、現時点において、日本人の持つ大腸がんの遺伝的リスクを最も反映しているPolygenicリスクスコアを明らかにすることと、Polygenicリスクスコアを取り入れることで、日本人の環境的なリスク要因で構成された大腸がんのリスク予測モデルの予測精度がどの程度改善するかを明らかにすることである。 本研究は、全国11か所の保健所管内に在住する40歳から69歳の地域住民を対象に1990年から追跡調査を行っている「多目的コホート研究」において、既に収集されている疾病罹患前の情報および試料を利用して実施している。「多目的コホート研究」の開発用ゲノムコホートB00で2009年までに把握された大腸がん症例748名、ならびに検証用ゲノムコホートB05で2009年までに把握された大腸がん症例208名については、イルミナ社のSNPマイクロアレイを用いたゲノム網羅的なジェノタイピングが行われている。 3年計画の1年度目にあたる2022年度は、大腸がんを対象にPolygenicリスクスコアの研究開発を行った研究のシステマティックレビューを行った。文献検索は、主にPubMedを用いて行い、Polygenic Score Catalog で過去の研究に漏れが無いか確認した。選択された文献から、Polygenicリスクスコアのアルゴリズムを抽出するとともに、研究のメタデータを記録した。並行して、「多目的コホート研究」の開発用ゲノムコホートB00の追跡期間を2015年まで延長することで新たに把握された大腸がん症例423名の追加タイピングを行った。得られたゲノムデータのクオリティーコントロールを行った後、1000人ゲノムプロジェクトのリファレンスパネルを参照したジェノタイプインピュテーションを実施し、イルミナ社のSNPマイクロアレイには含まれていない遺伝情報の統計学的な推定を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画書に定めた2022年度のマイルストンを概ね達成しているため。
|
今後の研究の推進方策 |
3年計画の2年度目にあたる2023年度は、Elastic-net cross-validation methodを用いた新たな機械学習により、既存のPolygenicリスクスコアを統合したより精度の高いPolygenicリスクスコアの研究開発を行う。2022年度に抽出した複数のPolygenicリスクスコアを候補とし、同年度中に追加タイピングしたことによって症例数が約1,200名に増えた開発用のゲノムコホートB00 において実施する。候補としたPolygenicリスクスコアが抽出された研究のメタデータを利用して、機械学習のアルゴリズムを改良し、より精度の高いPolygenicリスクスコアの研究開発を目指す。並行して、検証用のゲノムコホートB05の追跡期間を2015年まで延長することで新たに把握された大腸がん症例157名の追加タイピングを行う。得られたゲノムデータのクオリティーコントロールを行った後、1000人ゲノムプロジェクトのリファレンスパネルを参照したジェノタイプインピュテーションを実施し、イルミナ社のSNPマイクロアレイには含まれていない遺伝情報の統計学的な推定を行う。
|