研究課題/領域番号 |
22K10458
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分58010:医療管理学および医療系社会学関連
|
研究機関 | 独立行政法人国立病院機構(京都医療センター臨床研究センター) |
研究代表者 |
高橋 かおる 独立行政法人国立病院機構(京都医療センター臨床研究センター), 臨床研究企画運営部, 研究員 (50444609)
|
研究分担者 |
坂根 直樹 独立行政法人国立病院機構(京都医療センター臨床研究センター), 臨床研究企画運営部, 研究室長 (40335443)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | ストレスチェック / 特定健康診査 / 機械学習 / 生活習慣病 / 健康診断 |
研究開始時の研究の概要 |
健診機関で実施した職業性ストレスチェック結果、特定健康診査の検査および問診回答結果、その他健康診断の検査および問診回答結果を経年的に組み合わせて、職業性ストレスチェックの結果から将来の生活習慣病発症やその重症化、改善を予測するモデルを構築する。 モデルの開発には、従来からの古典的統計手法と機械学習の2者を用いる予定である。両者の予測精度を比較することにより、より精度の高いモデルを確立することを目指す。
|
研究実績の概要 |
研究の目的は、ストレスチェックの結果と特定健康診査および問診回答を活用して、生活習慣病発症および重症化予測プログラムを開発することである。プログラムの開発には、機械学習および従来のコックス比例ハザードモデルといった古典的統計解析手法の両者を用い、その精度を比較することも目的とする。 2022年度には、2016年度から2020年度にA健診機関で実施したストレスチェックと特定健診のデータを収集し、14,996名(平均年齢49.4歳、男性46.8%、平均BMI 22.7kg/m2、平均追跡日数1252日)のコホートを作成した。そしてランダムフォレストを用いた機械学習で5年間の糖尿病発症の予測精度を比較した。糖尿病発症の定義は、HbA1c>=6.5%もしくは糖尿病服薬である。その結果、 年齢、性別、BMI、血液検査(9項目)の予測精度が最も良好であった。ストレスチェックでは糖尿病発症予測の良好な結果は現時点では得られていない。 2023年度には、2024年度から始まる第4期特定健診・特定保健指導ではアウトカム評価となり、健診当日の保健指導実施を推奨することから、当日の健診結果が出る前に翌年のHbA1cのおおよその値を予測する精度を比較した。具体的には、HbA1cを5.6%以下、5.7~6.4%、6.5%以上の3区分に分類し、ランダムフォレストよりも精度の高いとされるXGBoostを用いて血液検査や問診票、ストレスチェックの組み合わせから最良のモデルを探索した。項目重要度の比較では、HbA1cが最も重要で年齢・BMI・飲酒・脂質異常症薬の服用・喫煙がそれに続いていた。 結果がまだ出ていない段階での保健指導や栄養指導においても、手元にある前回の血液検査結果や今回の基本的な健診項目の結果から、ある程度の糖尿病発症予測が可能で有効な指導に繋がることが示唆された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
前年に2016年度から2020年度までのストレスチェックおよび特定健康診査の結果を取得し、データの解析に着手し、機械学習について更に分析を進めている。
新型コロナウィルス禍の影響で、対面の研究者間の打ち合わせが予定よりも遅延しており、ストレスチェック結果の有効な活用方法や機械学習のパラメーター選択手法の選択をより検討すべきと考えている。 また、機械学習の欠損値の補完手法によっては、パソコンの容量が不足してしばしばフリーズしてしまい、多くの手法を施行できない。よりハイスペックのパソコンを購入する予定である。
|
今後の研究の推進方策 |
現時点で得られている機械学習の各種評価指標にまだ改善の余地があると考えており、その改善のために分類モデルや機械学習の方法を再検討していく。 具体的には、関連する先行研究を熟読し、現時点でわかっていることとわかっていないことを明確にする。それを基に仮説を立案し、仮説の合否の判断基準も事前に決めておく。過学習や、糖尿病 発症率が低いことから生じていると思われるデータの不均衡問題を改善すべく分類モデルの再構築を行う。また現在の躓きの原因の一つとなっているパソコンのスペック不足を解消すべく、機械学習に耐えうるハイスペックのパソコンに更新し、欠損補完等最適な機械学習の手法を選択していくことを目指す。
|