2022 Fiscal Year Research-status Report
レセプトデータによる医療・介護の経済分析と将来予測:GISによる可視化とAI予測
Project/Area Number |
22K10434
|
Research Institution | Hokkaido University |
Principal Investigator |
小笠原 克彦 北海道大学, 保健科学研究院, 教授 (90322859)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | レセプト / Ⅱ型糖尿病 / ベイジアンネットワーク / ランダムフォレスト / XG Boost |
Outline of Annual Research Achievements |
【目的】Ⅱ型糖尿病を対象に、医療介入前のデータであるBMI、腹囲、特定健康診査質問票からベイジアンネットワークを用いて重要度の高いリスク因子抽出を行い、ランダムフォレスト・XG Boostなどの機械学習によりⅡ型糖尿病の発症の予測と有効な予防方法を検討した。 【方法】北海道岩見沢市国保被保険者の 2013-2016年度のレセプトデータと 2011-2013年度の特定健康診査の検査データ、質問票7853人分より糖尿病罹患者195人、糖尿病でない人195人をランダムに抽出した計 390人分のデータを用いて、男女混合、男性のみ、女性のみの3種類のベイジアンネットワークによるモデル作成を行い、ベイズネットワーク図と予測変数の重要度のグラフを導出することでリスク因子の分析を行った。さらに、ランダムフォレスト、XG Boost による、正解率、AUC、重要度から糖尿病の発症予測と重要な因子の検討を行った。 【結果・考察】ベイジアンネットワークモデルにおいて男女混合モデルでは体型に関わる因子の重要度が高く、モデルの正解率は67.18%、男性モデルでは運動習慣に関わる因子の重要度が高く、モデルの正解率は80.18%、女性モデルでは体型に関わる因子の重要度が高く、モデルの正解率は77.98%となった。また、機械学習による評価では、医療介入前のデータではランダムフォレストは正解率が60.53%、AUC=0.606であり、XG Boostは正解率が 64.47%、AUC=0.706であった。XG Boostのほうがランダムフォレストより正解率、AUCともに高く、高精度な予測が可能であることが示唆された。また、ランダムフォレスト、XG Boostともに重要度が最も高いものはBMI、2番目に高いものが腹囲だったため、肥満がⅡ型糖尿病の大きなリスク因子であることが示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和4年度は、Ⅱ型糖尿病に焦点をあて、レセプトデータから疾病予測モデルの構築と機械学習の精度を検討した。その結果は疾病予測モデルの問題点が抽出され、精度も概ね妥当であると判断された。
|
Strategy for Future Research Activity |
令和4年度は、Ⅱ型糖尿病に焦点をあて、レセプトデータからAI技術を活用し、疾病予測モデルの構築と予測精度の検討した。令和5年度は、医療費を含めて予測モデルに当てはめ、医療費の予測を検討する。更に、郵便番号データなどを活用し、地図情報システムにより疾病地図および医療費地図の構築を検討する。
|
Causes of Carryover |
令和4年度では、本研究に関わる情報収集する予定であった医療情報学連合大会が地元札幌での開催となり、「旅費」が不要となり剰余金が発生した。また、令和4年度において、論文投稿の予定であったが、結果の算出が2月となったことから会計に間に合わなかった。そのため、校正費用および投稿費用を計上していた「その他」に剰余金が発生した。 令和5年度は、校正費用および投稿費用として使用する計画である。
|