2018 Fiscal Year Annual Research Report
Establishing prediction models for onset of chronic diseases using medical receipt database
Project/Area Number |
17H06629
|
Research Institution | The University of Tokyo |
Principal Investigator |
大野 幸子 東京大学, 大学院医学系研究科(医学部), 特任助教 (20797237)
|
Project Period (FY) |
2017-08-25 – 2019-03-31
|
Keywords | 医療ビッグデータ / 予測モデル |
Outline of Annual Research Achievements |
本研究では既存の医療ビッグデータに機械学習手法を適用し、種々の慢性疾患発症・重症化をより早期に予測するモデルを構築し、疾患発症・重症化リスクのある集団の早期特定に寄与することを目的とした。 平成29年度はSQL 言語を用いてJMDCより取得したレセプト・健診データの整形、結合を行い、甲状腺機能亢進症の予測モデル構築に必要なテーブル作成を行った。データに機械学習の各手法を適応し、Random forestでは重症バセドウ病の新規発症を陽性的中率100%、特異度83%で予測するモデルを構築した。一方、感度は30%未満となっており、今後の精度向上が課題として残された。平成30年度には、同データを用いて新規に血糖降下薬を開始した糖尿病患者において、ガイドラインアドヒアランスが腎機能の低下に与える影響について検討を行った。複数の機械学習手法および従来の疫学手法において同様の結果が得られ、ガイドラインアドヒアランスは腎機能の低下と関連しなかった。当該研究については国際学会で発表を行った。 さらに、予測モデル構築における検査値データの有用性を検討するため、協力施設から得られた日毎の検査値を含む医療データベースを用いて、腹部悪性手術後の創部感染、抗菌薬の再開、術後入院期間の予測を行った。創部感染、抗菌薬再開は症例数が少なく予測不能であったものの、Random Forestを用いた術後入院期間の予測値と実測値の差は10分位それぞれで2日以内であった。 現状の研究利用可能な医療レセプトデータは、サンプル数、説明変数、追跡期間が限られており、重症化や疾患の発症予測は困難であった。一方、術後入院期間は一定の精度で予測したため、既存の医療レセプトデータは機械学習を用いた短期的アウトカムの予測に利用できる可能性が示唆された。
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|
Research Products
(1 results)