2022 Fiscal Year Research-status Report
機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発
Project/Area Number |
21K17846
|
Research Institution | Tohoku University |
Principal Investigator |
永家 聖 東北大学, 東北メディカル・メガバンク機構, 講師 (00726466)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | フェノタイピング / リスクスコア / コホート / 医療情報 |
Outline of Annual Research Achievements |
本研究は、2型糖尿病などの循環器疾患を対象にしフェノタイピングを行い、ポリジェニックリスクスコアや環境リスクスコアを求め、さらにポリジェニック・環境リスクスコアの開発を目的としている。1年目は、株式会社JMDCより提供された特定健診情報・レセプト情報約3万人分のデータを用いて、精緻なフェノタイピングを行った。2年目は、当初ポリジェニックスコアや環境リスクスコアを計算する予定であったが、特定健康診査などの情報をもとに、人の健康状態を表現する3次元の「健康状態空間」を構築することで、その人の健康状態の遷移を把握することができると考え、この考えをリスクスコアの解釈に加えることでよりよい研究成果につながると考えた。42変数(問診票による検体検査17変数、生活習慣等25変数)、対象者96,093人(男性64,128人、女性31,965人))を用い、PCAとUMAPによる次元削減により健康状態空間を構築した。クラスタリングアルゴリズムDBSCANにより12個のクラスタを抽出し、さらに隣接行列から上位クラスタA~Eを同定した。健康上の問題がある上位クラスターB、C、D、E間の直接の移行は小さく、健康上の問題がない上位クラスターAを経由する必要があることが分かった。そこで、上部クラスターAをさらに階層化し、健康状態空間のどの遷移が、将来「健康」になるための有効な道筋となるかを検討していく予定である。これらクラスタの臨床的意義を付加することで、精緻な健康状態空間が解釈可能となり、さらにリスクスコアを計算する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発」を実施するため、表現型を精緻に決定するフェノタイピングの実施を行い、さらには次元削減により得られた領域ごとの特徴付けを行うなど、おおむね順調に進展している。具体的には、株式会社JMDCより提供された特定健診情報のうち、42変数(問診票による検体検査17変数、生活習慣等25変数)、対象者96,093人(男性64,128人、女性31,965人))を用い、PCAとUMAPによる次元削減により健康状態空間を構築した。クラスタリングアルゴリズムDBSCANにより12個のクラスタを抽出し、さらに隣接行列から上位クラスタA~Eを同定した。健康上の問題がある上位クラスターB、C、D、E間の直接の移行は小さく、健康上の問題がない上位クラスターAを経由する必要があることが分かった。そこで、上部クラスターAをさらに階層化し、健康状態空間のどの遷移が、将来「健康」になるための有効な道筋となるかを検討していく予定である。これらクラスタの臨床的意義を付加することで、精緻な健康状態空間が解釈可能となり、さらにリスクスコアを計算する予定である。
|
Strategy for Future Research Activity |
1年目に行った本研究課題の基礎となるフェノタイピングを実施しポリジェニックリスクスコアや環境リスクスコアの計算を計画していた。一方で人の健康状態を3次元で表現する「健康状態空間」を構築することで、その人の健康状態の遷移(過去や未来を含む)を把握することができると考え、まずはこの「健康状態空間」を定義し、解釈することを優先している。この「健康状態空間」をより精度よく緻密に調べるため、東北大学東北メディカル・メガバンク機構のコホート調査で得られた大規模なゲノム情報をどのように「健康状態空間」として表現するのかを検討している。「健康調査情報」だけではなく「ゲノム情報」を「健康状態空間」として表現することができれば、本研究のよりよい発展につなると期待される。
|
Causes of Carryover |
1年目は、当初旅費のみ計上していたが、コロナ禍で学会等がオンライン開催になったため、想定より少ない金額となった。2年目も、いくつかの学会等では現地開催されたが、オンラインも併用されていたため、旅費の執行は少なかった。また2年目に購入予定であった計算機サーバについて、負荷の高い計算を行うまでにいたらなかったため、購入を見送った。3年目には、自身が保有するリアルワールドデータに対する解析が進み、計算機サーバの購入等、適切な使用ができると考える。
|
Research Products
(1 results)