2018 Fiscal Year Research-status Report
Construction of artificial intelligence to predict incidence of hypertension and stroke based on machine learning, verification, and practice phases.
Project/Area Number |
17K19930
|
Research Institution | Teikyo University |
Principal Investigator |
大久保 孝義 帝京大学, 医学部, 教授 (60344652)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 倫広 東北医科薬科大学, 医学部, 助教 (70717892)
|
Project Period (FY) |
2017-06-30 – 2020-03-31
|
Keywords | 高血圧 / 機械学習 / 成人保健 |
Outline of Annual Research Achievements |
株式会社JMDC(旧:医療情報データセンター)から受領した39万名分の健診データ情報から、初回健診時の情報とその5年後の健診情報を抽出し、データ連結した。高血圧発症予測モデルを構築するための対象者として、性別や年齢といった基礎情報が無い者、および初回健診時に高血圧有病者を除外し、218,976名(男性 67.2%、年齢45.0歳)を抽出した。追跡5年後、対象者の12.8%が高血圧(収縮期/拡張期血圧が140/90 mmHg以上または降圧薬服用有り)を有していた。高血圧発症者は、非発症者に比べ、男性(78.8% vs 65.5%)、喫煙習慣有りの者(35.7% vs 30.8%)、飲酒習慣有りの者(35.9% vs 25.5%)、糖尿病有病者(6.6% vs 2.9%)、脂質異常症有病者(51.8% vs 37.8%)、脳卒中既往者(0.6% vs 0.3%)および虚血性心疾患既往者(1.6% vs 0.9%)の割合が高く、高齢(47.4歳 vs 44.6歳)、body mass indexが高く(24.0 kg/m2 vs 22.3 kg/m2)、および、ベースライン収縮期/拡張期血圧が高値であった(125.7/79.3 mmHg vs 114.9/70.9 mmHg)(二変量解析 all P<0.0001)。これらすべての基礎特性を用いたロジスティック回帰分析を用いたところ、5年後高血圧発症を目的変数としたモデルの決定係数は0.138であった。並行して、Scikit-learnを用いた高血圧発症予測モデルの構築を試みている。欠損地の処理や変数選択などの前処理を行っており、複数の検討結果の精度を測っている。 一方、大迫コホート研究については、例年実施する家庭血圧測定を実施した。2018年度対象の内川目地区の対象者から家庭血圧データを収集し、併せて、55歳以上の希望者を対象とした検診により、血液検査データ、ならびに頭部MRIや動脈硬化に関する情報も得られた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
JMDCおよび大迫研究データの受領と整備はほぼ完了しているが、佐久研究データの本研究課題に用いるためのデータベースの構築が進んでいない。また、機械学習モデルへの適応の前処理と検証の作業に時間を要している。
|
Strategy for Future Research Activity |
ロジスティック回帰分析を用いた高血圧発症予測モデルの精度が想定よりも低かった。そのため、まずレセプト情報との突合により問診データの信頼性を確認し、さらにJMDCデータの精度を上げる。JMDCデータで高血圧発症予測モデルを構築したのちは、大迫町住民データに適用し、モデルの精度を測る。未受診かつハイリスク者と考えられる対象については、その後の状況を把握する。同様の検討を、JMDCデータではなく、佐久研究データを用いて実施する。
|
Causes of Carryover |
(理由)研究進捗状況が想定よりも遅れたため。 (使用計画)研究成果の発表や情報交換に伴う旅費、データベース作成に必要なデータ編集ソフトなどに利用予定である。
|
Research Products
(3 results)