2023 Fiscal Year Research-status Report
Project/Area Number |
23K16274
|
Research Institution | National Hospital Organization Headquarters |
Principal Investigator |
井上 紀彦 独立行政法人国立病院機構本部(総合研究センター), 診療情報分析部, 主任研究員 (60867068)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Keywords | DPC / レセプト / バリデーション / 乳癌 / 診療情報 |
Outline of Annual Research Achievements |
国立病院機構の保有するレセプト、包括支払制度DPCデータ及び電子カルテ情報の精度・妥当性を統計学的に検証するバリデーション研究を実施してきた。診療報酬請求情報や電子カルテの記録を用いることも多いデータベース疫学研究では、論文査読時にその記録の信頼性を査読者から求められることも多い。電子カルテ情報や診療情報データベースの記録の妥当性を検証するバリデーション研究によってもたらされる知見は、診断名や処方・診療行為の情報の精度を確かめ、実際の研究として応用した際にその結果が信頼できるかどうかの判断基準にもなる。 本年は乳癌の転移・再発及び、入院患者の死亡退院などの入退院関連情報を対象として、全体の基礎統計情報(feasibility)、患者年齢や性別、ICD-10コードに基づく傷病名や合併症、薬剤、手術、麻酔などの医療行為を結合したデータセットの作製、診療情報データベース側と病院カルテや院内レジストリの記録との整合性・妥当性の検証(バリデーション)、データベース中のイベント特定と診療実態の解明に資するAI・機械学習・統計モデルの開発を進めていった。乳癌患者においては、NHO本部に集積されているレセプト・DPCデータという診療報酬請求情報と、同じく本部に集積された電子カルデデータベースにおける診断名の付けられ方を、正確度や陽性的中率などの統計学的指標を用いつつ確かめていった。さらに病院の持っている電子カルテ情報から実際にイベントが発生していたかどうかや、癌のステージ情報、検査結果など関連する診療情報も集めて、統計学的に情報が一致しているかどうか確かめるバリデーションを進めていった。これら情報を用いて統計予測モデル作成を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データ抽出に関連した予備調査などを事前に進めていたこともあって、データ抽出をスムースに行えた。
|
Strategy for Future Research Activity |
乳癌についてはバリデーションを進めていけている。入院死亡については、対象患者数(1万人以上)や国立病院機構140病院を網羅することが費用面・時間面で非常に困難であるため、ひとまず全病院における基本統計量を把握するところまで進めた。今回取り組んできた統計モデルによる予測はロジスティック回帰モデルなどの古典的な統計モデル、ランダムフォレストやXgBoostなどの機械学習系モデル、ディープラーニングなどを用いていくことを予定しているが、レセプトデータの記録特性からこれらモデル間の予測精度が大きく変わりうることや、日本全国の患者を対象としたときに計算時間コストが非常に高いなど、新たな課題がわかってきた。データソースとしてレセプトやDPCのデータを用いていることで、こうした統計モデルの構築ノウハウは日本全国の病院データにおいて活用できるものであり、多くの医学分野においても活用できるため他疾患への応用的適用を含めて今後の検討及び研究を進めていく。
|
Causes of Carryover |
コロナ感染の影響で演題採択されていた学会参加を断念したためと、巨大データを加工するのに必要な高性能ワークステーション購入予定であったが、近年のコロナ流行と世界的インフレ・円安による半導体流通不足による製品供給途絶と価格高騰の影響があり、想定していた性能を満たす製品が購入できなかった。2024年4月以降、供給が改善されてきているため速やかに予算執行を行っていく予定である。
|