研究課題/領域番号 |
21K17846
|
研究機関 | 東北大学 |
研究代表者 |
永家 聖 東北大学, 東北メディカル・メガバンク機構, 准教授 (00726466)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | フェノタイピング / リスクスコア / コホート / 医療情報 |
研究実績の概要 |
本研究は、2型糖尿病などの循環器疾患を対象にフェノタイピングを行い、ポリジェニックリスクスコアや環境リスクスコアをそれぞれ求め、さらに統合したポリジェニック・ 環境リスクスコアの開発を目的としている。1年目は、株式会社JMDCより提供された特定健診情報・レセプト情報約10万人分のデータを用いて、精緻なフェノタイピングを行った。2年目は、当初ポリジェニックスコアや環境リスクスコアを計算する予定であったが、特定健康診査などの情報をもとに、ヒトの健康状態を表現する3次元の「健康状態空間」を構築することで、その人の健康状態の遷移を把握することができると考えた。この考えをリスクスコアの解釈に加えることでよりよい研究成果につながると考えた。42変数(問診票による検体検査17変数、生活習慣等25変数)、対象者96,093人(男性64,128人、女性31,965人)を用い、PCAとUMAPによる次元削減により健康状態空間を男女別に構築した。クラスタリングアルゴリズムDBSCANによりクラスタ(男性49個、女性36個)を同定し、特徴付けを行った。特徴付けには、検査値を用いた対象疾患のフェノタイピング、レセプトデータの診断名を用いた。そうすることで健康とされる大きなクラスタのなかに、疾患発症前のクラスタや(スーパー)ヘルシーなクラスタが存在することを網羅的に明らかにした。これらクラスタの臨床的意義を付加することで、精緻な健康状態空間が解釈可能となり、さらにリスクスコアを加えることで、健康状態空間のどの遷移が、将来「健康」になるための有効な道筋となるかを検討している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
「機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発」を実施するため、表現型を精緻に決定するフェノタイピングの実施を行い、さらには次元削減により得られたクラスタごとの特徴付けを行うなど、おおむね順調に進展している。具体的には、株式会社JMDCより提供された4年間の大規模な健診・レセプトデータのうち、42変数(問診票による検体検査17変数、生活習慣等25変数)、対象者96,093人(男性64,128人、女性31,965人)を用い、PCAとUMAPによる次元削減により健康状態空間を構築した。特に質的変数・量的変数に対応できるPCAを採用し、さらにUMAPの計算処理の高速化を行った。 クラスタリングアルゴリズムDBSCANによりクラスタ(男性49個、女性36個)を同定し、特徴付けを行った。健診データは、対象疾患について、疾患発症前/後なのかをラベルして特徴付けを行った。健康とされる大きなクラスタのなかに、疾患発症前のクラスタや(スーパー)ヘルシーなクラスタが存在することを網羅的に明らかにした。 これらクラスタの臨床的意義を付加することで、精緻な健康状態空間が解釈可能となり、さらにリスクスコアを加えることで、健康状態空間のどの遷移が、将来「健康」になるための有効な道筋となるかを検討している。
|
今後の研究の推進方策 |
本研究課題の基礎となるフェノタイピングを1年目に実施した。その後、ポリジェニックリスクスコアや環境リスクスコアの計算を計画していた。 一方でヒトの健康状態を3次元で表現する「健康状態空間」を構築することで、そのヒトの健康状態の遷移(過去や未来を含む)を把握することができると考え、 まずはこの「健康状態空間」を定義し、解釈することを優先し研究を推進していた。この「健康状態空間」をより精度よく緻密に調べるため、東北大学東北メディカル・メガバンク機構のコホート調査で得られた大規模な健康調査情報やゲノム情報をどのように「健康状態空間」として表現するのかを検討した。従来の「健康調査情報」だけではなく、「ゲノム情報」を「健康状態空間」として表現することができれば、本研究のよりよい発展につながると期待されるため、「ゲノム情報」からのポリジェニックリスクスコア、「健康調査情報」からの環境リスクスコアの統合を進める。
|
次年度使用額が生じた理由 |
1年目:当初旅費のみ計上していたが、コロナ禍で学会等がオンライン開催になったため、想定より少ない金額となった。 2年目:いくつかの学会等では現地開催されたが、オンラインも併用されていたため、旅費の執行は少なかった。また2年目に購入予定であった計算機サーバについて、計算負荷の高い処理を行うまでに至らなかったため、購入を見送った。 3年目:自身が保有するリアルワールドデータを用いた解析が進み、また計算コストを省力化することができたため、計算機サーバの購入までには至らなかった。 4年目:これまでの研究成果を国内外の学会等で発表する。
|