2022 Fiscal Year Annual Research Report
Development of risk prediction model for re-admission in large inpatient data with machine learning
Project/Area Number |
19K19430
|
Research Institution | University of Tsukuba |
Principal Investigator |
岩上 将夫 筑波大学, 医学医療系, 准教授 (30830228)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 機械学習 / 再入院 / 臨床予測モデル / リアルワールドデータ |
Outline of Annual Research Achievements |
最終年度は、これまでの研究成果をまとめ、学会発表および論文執筆~投稿を行った。 研究実績の概要:本研究では30日以内の予定外再入院の予測を目的に、gradient-boosted decision tree(GBDT)、random forest(RF)、deep neural network(DNN)、logistic regression with the least absolute shrinkage and selection operator(LR-LASSO)のうち、どのモデルの予測性能がよいか、予測変数の数と採血検査結果の有無に応じて、比較検討を行った。38病院から生存退院した患者の電子カルテ情報、具体的には基本特性(年齢、性別、入院診断カテゴリー、過去1年間の入院回数、退院先)、診断、手術、処置、薬剤コード、血液検査結果を用いた。モデルの開発に2015~2017年(n=339,513)、モデルの検証に2018年(n=118,074)の情報を利用した。2値変数の数(患者の5%以上または1%以上、あるいは10人以上が有する変数の数)および採血検査結果の有無により、異なる6パターンのデータセットを作成した。主な結果として、予測変数が最も少ないデータセット(102個)では、c統計量はGBDT(0.740)が最も高く、次いでRF(0.734)、LR-LASSO(0.720)、DNN(0.664)の順となった。予測変数が最も多いデータセット(1543個)では、c統計量はGBDT(0.764)が最も高く、次いでLR-LASSO(0.755)、RF(0.751)、DNN(0.720)の順となった。このように、GBDTの予測能が最も高く、概ねLR-LASSOの予測能を上回ったが、予測変数の数が増え、また採血検査結果を用いると、その差はむしろ小さくなることが明らかになった。
|
-
[Journal Article] Comparison of machine-learning and logistic regression models to predict 30-day unplanned readmission: a development and validation study2023
Author(s)
Masao Iwagami, Ryota Inokuchi, Eiryo Kawakami, Tomohide Yamada, Atsushi Goto, Toshiki Kuno, Yohei Hashimoto, Nobuaki Michihata, Tadahiro Goto, Tomohiro Shinozaki, Yu Sun, Yuta Taniguchi, Jun Komiyama, Kazuaki Uda, Toshikazu Abe, Nanako Tamiya
-
Journal Title
medRxiv
Volume: -
Pages: -
DOI
Open Access
-
-