2021 Fiscal Year Research-status Report
機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発
Project/Area Number |
21K17846
|
Research Institution | Tohoku University |
Principal Investigator |
永家 聖 東北大学, 東北メディカル・メガバンク機構, 講師 (00726466)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | フェノタイピング / リスクスコア / コホート / 医療情報 |
Outline of Annual Research Achievements |
本研究は、2型糖尿病などの循環器疾患を対象にし、ポリジェニック・環境リスクスコアの開発を目的としている。 1年目は、表現型を精緻に決定するフェノタイピングを行う計画であった。東北大学東北メディカル・メガバンク機構にて収集・解析済みの15万人分のゲノム情報・健康調査情報を利用する前に、株式会社JMDCより提供された特定健診情報・レセプト情報約3万人分のデータを用いて、解析を行った。具体的には、特定健診情報のうち、血糖値とHbA1cの2項目を用いて、糖尿病を4種類の病型(正常型、正常高値型、境界型、糖尿病型)に分類を行った。 次に特定健診情報・レセプト情報42変数、約3万人分の女性の高次元データに対してtSNEにより次元削減を行い2次元で表現した。この結果を4種類の病型で分割することで、正常型は多様性があり全体にある程度の密度で分布していること、境界型や糖尿病型は1-2個のクラスタに集約されていることが分かった。さらに、2次元に縮約された結果を小さな領域に区切り、各領域の特徴付けを特定健診情報(検体検査・問診票による生活習慣等)、レセプト情報(投薬・病名)を用いて行った。具体的には、境界型の病型には2つのクラスタがあり、1つ目のクラスタには「糖尿病(82.4%)」と「2型糖尿病(57.2%)」の2種類が併存疾患として現れており、研究計画時に想定していたレセプト病名の影響を受けていることが確認できた。 今後この特徴付けされた変数をもとに、リスクスコアの計算を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「機械学習によるフェノタイピングにもとづくポリジェニック・環境リスクスコアの開発」を実施するため、表現型を精緻に決定するフェノタイピングの実施を行い、さらには次元削減により得られた領域ごとの特徴付けを行うなど、おおむね順調に進展している。 具体的には、株式会社JMDCより提供された特定健診情報のうち、HbA1cと血糖値の2項目を用いて糖尿病を4種類の病型(正常型、正常高値型、境界型、糖尿病型)に分類を行った。さらに、特定健診情報・レセプト情報42変数、約3万人分の女性の高次元データに対してtSNEにより次元削減を行い2次元で表現した。この結果を4種類の病型で分割することで、正常型は多様性があり全体にある程度の密度で分布していること、境界型や糖尿病型は1-2個のクラスタに集約されていることが分かった。さらに、2次元に縮約された結果を小さな領域に区切り、各領域の特徴付けを特定健診情報(検体検査・問診票による生活習慣等)、レセプト情報(投薬・病名)を用いて行った。具体的には、境界型の病型には2つのクラスタがあり、1つ目のクラスタには「糖尿病(82.4%)」と「2型糖尿病(57.2%)」の2種類の併存疾患だけではなく、糖尿病の合併症である糖尿病網膜症を併発していることが分かった。つまり研究計画時に想定していたレセプト病名の影響を受けていることが確認できた。さらに当該クラスタには、糖尿病治療薬であるメトグルコ錠やジャヌビア錠が高頻度で出現していることも確認できた。 今後この特徴付けされた変数をもとに、ポリジェニックリスクスコアや環境リスクスコアの計算を行う予定である。 また、本研究に関連した学内でのセミナーを実施し、研究協力者以外の研究者からの質疑やアドバイスに対応することで、本研究をさらに進展させていくことが可能となった。
|
Strategy for Future Research Activity |
1年目に行った本研究課題の基礎となるフェノタイピングの実施と得られた特徴空間を特定健診情報やレセプト情報で特徴付けを発展させて、ポリジェニックリスクスコアや環境リスクスコアの計算を行う予定である。使用するデータについては、1年目同様に株式会社JMDCより提供された特定健診情報・レセプト情報で手法の検証を行い、東北大学東北メディカル・メガバンク機構のコホート調査で得られた大規模な健康調査情報やゲノム情報に適用する予定である。 また、1年目に実施したセミナー等による研究者からのアドバイスは大変有用であったため、今後も継続的に学内外含めて実施することで、よりよい研究にしていくことが可能だと考える。
|
Causes of Carryover |
1年目は、当初旅費のみ計上していたが、コロナ禍で学会等がオンライン開催になったため、想定より少ない金額となった。2年目以降は、学会等の現地開催も見込まれるため、適切に使用できると考える。
|