• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

機械学習とストレスチェックを活用した生活習慣病発症・重症化予測プログラムの開発

Research Project

Project/Area Number 22K10458
Research InstitutionDepartment of Clinical Research, National Hospital Organization Kyoto Medical Center

Principal Investigator

高橋 かおる  独立行政法人国立病院機構(京都医療センター臨床研究センター), 臨床研究企画運営部, 研究員 (50444609)

Co-Investigator(Kenkyū-buntansha) 坂根 直樹  独立行政法人国立病院機構(京都医療センター臨床研究センター), 臨床研究企画運営部, 研究室長 (40335443)
Project Period (FY) 2022-04-01 – 2025-03-31
Keywordsストレスチェック / 特定健康診査 / 機械学習
Outline of Annual Research Achievements

研究の目的は、ストレスチェックの結果と特定健康診査および問診回答を活用して、生活習慣病発症および重症化予測プログラムを開発することである。プログラムの開発には、機械学習および従来のコックス比例ハザードモデルといった古典的統計解析手法の両者を用い、その精度を比較することも目的とする。
2022年度には、2016年度から2020年度にA健診機関で実施したストレスチェックと特定健診のデータを収集し、14,996名(平均年齢49.4歳、男性46.8%、平均BMI 22.7kg/m2、平均追跡日数1252日)のコホートを作成した。そしてランダムフォレストを用いた機械学習で5年間の糖尿病発症の予測精度を比較した。糖尿病発症の定義は、HbA1c>=6.5%もしくは糖尿病服薬である。その結果、 年齢、性別、BMI、血液検査(9項目)の予測精度が最も良好であった。ストレスチェックでは糖尿病発症予測の良好な結果は現時点では得られていない。
2023年度には、2024年度から始まる第4期特定健診・特定保健指導ではアウトカム評価となり、健診当日の保健指導実施を推奨することから、当日の健診結果が出る前に翌年のHbA1cのおおよその値を予測する精度を比較した。具体的には、HbA1cを5.6%以下、5.7~6.4%、6.5%以上の3区分に分類し、ランダムフォレストよりも精度の高いとされるXGBoostを用いて血液検査や問診票、ストレスチェックの組み合わせから最良のモデルを探索した。項目重要度の比較では、HbA1cが最も重要で年齢・BMI・飲酒・脂質異常症薬の服用・喫煙がそれに続いていた。
結果がまだ出ていない段階での保健指導や栄養指導においても、手元にある前回の血液検査結果や今回の基本的な健診項目の結果から、ある程度の糖尿病発症予測が可能で有効な指導に繋がることが示唆された。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

前年に2016年度から2020年度までのストレスチェックおよび特定健康診査の結果を取得し、データの解析に着手し、機械学習について更に分析を進めている。

新型コロナウィルス禍の影響で、対面の研究者間の打ち合わせが予定よりも遅延しており、ストレスチェック結果の有効な活用方法や機械学習のパラメーター選択手法の選択をより検討すべきと考えている。
また、機械学習の欠損値の補完手法によっては、パソコンの容量が不足してしばしばフリーズしてしまい、多くの手法を施行できない。よりハイスペックのパソコンを購入する予定である。

Strategy for Future Research Activity

現時点で得られている機械学習の各種評価指標にまだ改善の余地があると考えており、その改善のために分類モデルや機械学習の方法を再検討していく。
具体的には、関連する先行研究を熟読し、現時点でわかっていることとわかっていないことを明確にする。それを基に仮説を立案し、仮説の合否の判断基準も事前に決めておく。過学習や、糖尿病
発症率が低いことから生じていると思われるデータの不均衡問題を改善すべく分類モデルの再構築を行う。また現在の躓きの原因の一つとなっているパソコンのスペック不足を解消すべく、機械学習に耐えうるハイスペックのパソコンに更新し、欠損補完等最適な機械学習の手法を選択していくことを目指す。

Causes of Carryover

引き続き学会発表を予定しているので、そのため旅費などに使用予定である。パソコンのスペック不足を解消すべく、機械学習に耐えうるハイスペックのパソコンの更新のために使用する。

  • Research Products

    (1 results)

All 2023

All Presentation (1 results)

  • [Presentation] 健診現場で活用できる機械学習を用いた糖尿病発症の予測法の開発2023

    • Author(s)
      高橋 かおる, 安田 敏成, 菅沼 彰子, 坂根 直樹
    • Organizer
      第66回日本糖尿病学会年次学術集会

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi