• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発

研究課題

研究課題/領域番号 21K17846
研究種目

若手研究

配分区分基金
審査区分 小区分62010:生命、健康および医療情報学関連
研究機関東北大学

研究代表者

永家 聖  東北大学, 東北メディカル・メガバンク機構, 准教授 (00726466)

研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
キーワードフェノタイピング / リスクスコア / コホート / 医療情報 / ポリジェニックリスクスコア / 環境リスクスコア
研究開始時の研究の概要

個人の疾患発症リスクを予測するポリジェニックリスクスコアや、環境因子を用いた環境ワイドな環境リスクスコアを構築する際に用いるフェノタイプ情報は、カルテ情報から得られていることが多い。しかしながら、カルテに記載されている疾患情報は、診療目的の診断病名であり、研究目的にそのまま利用するのは適切ではない。
そこで本研究では、ルールベースや機械学習によるフェノタイピングにもとづく層別化されたサブグループごとに、ポリジェニックリスクスコアや環境リスクスコアを開発することで、より精緻なリスクスコアを得ることを目的とする。

研究実績の概要

本研究は、2型糖尿病などの循環器疾患を対象にフェノタイピングを行い、ポリジェニックリスクスコアや環境リスクスコアをそれぞれ求め、さらに統合したポリジェニック・ 環境リスクスコアの開発を目的としている。1年目は、株式会社JMDCより提供された特定健診情報・レセプト情報約10万人分のデータを用いて、精緻なフェノタイピングを行った。2年目は、当初ポリジェニックスコアや環境リスクスコアを計算する予定であったが、特定健康診査などの情報をもとに、ヒトの健康状態を表現する3次元の「健康状態空間」を構築することで、その人の健康状態の遷移を把握することができると考えた。この考えをリスクスコアの解釈に加えることでよりよい研究成果につながると考えた。42変数(問診票による検体検査17変数、生活習慣等25変数)、対象者96,093人(男性64,128人、女性31,965人)を用い、PCAとUMAPによる次元削減により健康状態空間を男女別に構築した。クラスタリングアルゴリズムDBSCANによりクラスタ(男性49個、女性36個)を同定し、特徴付けを行った。特徴付けには、検査値を用いた対象疾患のフェノタイピング、レセプトデータの診断名を用いた。そうすることで健康とされる大きなクラスタのなかに、疾患発症前のクラスタや(スーパー)ヘルシーなクラスタが存在することを網羅的に明らかにした。これらクラスタの臨床的意義を付加することで、精緻な健康状態空間が解釈可能となり、さらにリスクスコアを加えることで、健康状態空間のどの遷移が、将来「健康」になるための有効な道筋となるかを検討している。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

「機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発」を実施するため、表現型を精緻に決定するフェノタイピングの実施を行い、さらには次元削減により得られたクラスタごとの特徴付けを行うなど、おおむね順調に進展している。具体的には、株式会社JMDCより提供された4年間の大規模な健診・レセプトデータのうち、42変数(問診票による検体検査17変数、生活習慣等25変数)、対象者96,093人(男性64,128人、女性31,965人)を用い、PCAとUMAPによる次元削減により健康状態空間を構築した。特に質的変数・量的変数に対応できるPCAを採用し、さらにUMAPの計算処理の高速化を行った。
クラスタリングアルゴリズムDBSCANによりクラスタ(男性49個、女性36個)を同定し、特徴付けを行った。健診データは、対象疾患について、疾患発症前/後なのかをラベルして特徴付けを行った。健康とされる大きなクラスタのなかに、疾患発症前のクラスタや(スーパー)ヘルシーなクラスタが存在することを網羅的に明らかにした。
これらクラスタの臨床的意義を付加することで、精緻な健康状態空間が解釈可能となり、さらにリスクスコアを加えることで、健康状態空間のどの遷移が、将来「健康」になるための有効な道筋となるかを検討している。

今後の研究の推進方策

本研究課題の基礎となるフェノタイピングを1年目に実施した。その後、ポリジェニックリスクスコアや環境リスクスコアの計算を計画していた。
一方でヒトの健康状態を3次元で表現する「健康状態空間」を構築することで、そのヒトの健康状態の遷移(過去や未来を含む)を把握することができると考え、
まずはこの「健康状態空間」を定義し、解釈することを優先し研究を推進していた。この「健康状態空間」をより精度よく緻密に調べるため、東北大学東北メディカル・メガバンク機構のコホート調査で得られた大規模な健康調査情報やゲノム情報をどのように「健康状態空間」として表現するのかを検討した。従来の「健康調査情報」だけではなく、「ゲノム情報」を「健康状態空間」として表現することができれば、本研究のよりよい発展につながると期待されるため、「ゲノム情報」からのポリジェニックリスクスコア、「健康調査情報」からの環境リスクスコアの統合を進める。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (2件)

すべて 2023 2022

すべて 学会発表 (2件)

  • [学会発表] Elucidation of trajectories from healthy state to mibyo and disease onset through large-scale specific health checkup data2023

    • 著者名/発表者名
      Nagaie Satoshi, Mizuno Satoshi, Ishiwata Rryosuke, Ogishima Soichi
    • 学会等名
      Chem-Bio Informatics Society Annual Meeting 2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Five cluster groups found in the health state space of 96,093 population2022

    • 著者名/発表者名
      Nagaie Satoshi, Mizuno Satoshi, Ishiwata Rryosuke, Ogishima Soichi
    • 学会等名
      Chem-Bio Informatics Society Annual Meeting 2022
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi