2023 Fiscal Year Annual Research Report
Identification of prognostic factors for elderly hospitalized patients with multiple diseases: improving interpretability of machine learning models.
Project/Area Number |
18K18471
|
Research Institution | Yokohama City University |
Principal Investigator |
清水 沙友里 横浜市立大学, データサイエンス研究科, 講師 (60625408)
|
Co-Investigator(Kenkyū-buntansha) |
原 聡 大阪大学, 産業科学研究所, 准教授 (40780721)
伏見 清秀 東京医科歯科大学, 大学院医歯学総合研究科, 教授 (50270913)
|
Project Period (FY) |
2018-06-29 – 2024-03-31
|
Keywords | データベース研究 / 機械学習 / スパースデータ |
Outline of Annual Research Achievements |
複数疾患を持つ身体的に脆弱な高齢者が増加してることにより、データベース研究におけてそれらを包括的な視点から評価を行い、臨床評価に役立てることは重要な課題であるが、複数疾病のある患者に対して、それらの並存パターンの重症度評価は十分ではない。社会医学領域においては、予測力に劣る線形回帰モデルの利用から脱却できておらず、手法論的に挑戦可能な課題が数多く残っている。これまでは、統計学的なモデルと機械学習モデルの比較を行い、医学系データベースにおいて、機械学習モデルのフィットに課題のあることが明らかとなった。そこでモデルの精度向上のため、その他の機械学習手法を応用し、予後予測因子のより精緻な同定を行った。
診療行為に関する情報は、医学的に情報量のあるデータであるが、医学系研究の対象集団は絞り込む必要があり、データベース研究においても集団の数がある程度限定されるという特性がある。そのため、変数の次元の高さにより全てのデータを予測モデルに入れることが現実的ではなかった。これまでの研究におより、次元削減等の手法を用いることで、これらのデータを利用可能にし、かつ予測モデル精度の向上が可能であることが示唆された。今年度は、一般化可能性を確認するため、急性期医療機関のデータを用いて、診療行為情報などのスパースなカテゴリカルデータを数値化するための複数の手法を用いてた比較研究を行ったが、最終的にはPropensity score matching法を採用することとなった。
|