大規模医療介護ダミーデータベースの構築と精密医療への応用

研究課題

研究課題/領域番号	23K21503
補助金の研究課題番号	21H03159 (2021-2023)
研究種目	基盤研究(B)
配分区分	基金 (2024) 補助金 (2021-2023)
応募区分	一般
審査区分	小区分58010:医療管理学および医療系社会学関連
研究機関	東京大学
研究代表者	松居宏樹東京大学, 大学院医学系研究科(医学部), 准教授 (70608794)
研究分担者	笹渕裕介東京大学, 大学院医学系研究科(医学部), 特任准教授 (40782339) 康永秀生東京大学, 大学院医学系研究科(医学部), 教授 (90361485)
研究期間 (年度)	2021-04-01 – 2025-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	17,810千円 (直接経費: 13,700千円、間接経費: 4,110千円) 2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円) 2023年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円) 2022年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円) 2021年度: 11,050千円 (直接経費: 8,500千円、間接経費: 2,550千円)
キーワード	大規模医療データ / 深層学習 / 生成データ / 大規模医療データベース / 分散表現 / 因果推論 / 効果修飾 / 大規模医療介護データベース / ダミーデータ / 精密医療 / レセプトデータベース
研究開始時の研究の概要	患者背景によって治療効果が異なるEffect Modification（効果修飾）を考慮し治療戦略を細かく設定する手法である。まず、ダミーデータベースにより機械学習を用いて検証した治療効果推定の精度を検証する。さらに、この機械学習モデルを用いて臨床現場の意思決定を支援するシステムの構築を目指す。
研究実績の概要	近年、各種の大規模医療介護データベースが整備されている。しかしいずれも、個人情報保護等を理由として、利用には様々な手続きや規制があり、利用者は極めて限定されている。利用経験が少ないためにデータベースの扱いに慣れておらず、そのために研究成果がなかなか得られないという現状もある。そこで申請者は、個人情報保護の必要がない大規模ダミーデータベースを独自に構築し、それを研究者に幅広く利用してもらい、データベース研究のトレーニングや仮説構築に役立ててもらうことを第一の目的とした。昨年度は、研究に用いる各種医療介護データベースへのアクセスについて、管理者の承認を得て、倫理委員会の承認を受けた。また、国が保有する大規模レセプトデータベース（NDB）についても、本研究に関連したテーマで利用申請を提出し承認された。次に、ダミーデータ構築を目的として、DB構造の基礎設計を行い、実際に疫学研究・教育への利用を想定したシステム設計を行った。今年度は設計したシステムにレセプトサンプルデータを基にしたダミーデータ乗せ、をWeb アプリケーションとして実装した。具体的には、WebAssembly として動作するPostgresql 上に、構築したDBを教育向けに利用した。さらに、ダミーデータを生成するためのモデルを構築する際に必要となる技術として、レセプトコードの分散表現を取得する必要があった。当初計画通り、分散表現の獲得を行ったが、その分散表現の因果推論への応用を試みた。この手法は、極めて多変量のデータを用いて因果推論を行う場合の交絡調整に有効である。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究の目的を達成するうえで、まず、実在の大規模医療介護データベースへのアクセスを確保する必要がある。今年度はレセプトサンプルデータを基にしたダミーデータを作成し、教育と臨床疫学研究への応用を行った。複数名の研究所学者がダミーデータを利用し、研究計画・データの抽出計画を構築することができ研究の応用までプロジェクトが進んでいる。また、構築した分散表現を因果推論へ応用する手法を開発した。 2018年4月から2020年3月の間のDPCデータベースを利用した。研究は以下で構成した。i) すべての医療請求情報データに含まれるコード（レセプト電算コード・ICD10コード）についてword2vec を用いて分散表現を作成した。 ii) 既報の臨床疫学研究に基づき、心不全患者を対象とし、その医療請求情報データを抽出した。このデータをシミュレーションに用い、4つのリスク調整法（調整なし（Model 1）、既報の臨床疫学研究で報告された交絡因子の調整（シミュレーションにおける真のリスク調整モデル、Model 2）、入院初日の全医療請求情報データに分散表現重みを紐づけ、その合計を計算しリスク調整に用いる（提案手法、Model 3）、Model 2と3の組み合わせ（Model 4））で、推定された効果量と曝露群と対照群間の共変量バランスを比較した。iii) 既報の臨床疫学研究（心不全患者における早期リハビリテーションの効果を検討）のリスク調整にModel 1-4を適用した。それぞれのリスク調整法の結果を比較した。シミュレーションにおいて、分散表現が高次元医療請求情報データを圧縮し、未測定交絡因子の影響のある比較効果研究のリスク調整に役立つことを示し、2023年度臨床疫学会で発表し、優秀演題賞を獲得した。
今後の研究の推進方策	従来の研究計画に沿って研究をすすめる。今年度までで、サンプルデータを用いたレセプトダミーデータを構築し、研究・教育利用することに成功している。さらに、大規模なレセプトデータベースを用いて因果推論を行う上で、大規模データをそのままモデルに投入する方法を構築できた。今年度は、まず、大規模データを用いた生成モデルを構築する。これにより、大規模な医療ダミーデータベースを生成する。大規模な医療ダミーデータベースを用いることで、すでに構築した教育プログラムを更新する。さらに、今年度開発したレセプトデータベースを用いて因果推論を行う手法を応用し、因果推論およびEffect Modification に関するテーマも検討する。

報告書

(3件)

研究成果
(11件)

すべて 2024 2023 2022 2021 その他

すべて雑誌論文 (7件) (うち査読あり 7件、オープンアクセス 7件) 学会発表 (3件) 備考 (1件)

[雑誌論文] Epidemiology of severe childhood asthma in Japan: A nationwide descriptive study2024
- 著者名/発表者名
  Kimura Yuya、Suzukawa Maho、Jo Taisuke、Hashimoto Yohei、Kumazawa Ryosuke、Ishimaru Miho、Matsui Hiroki、Yokoyama Akira、Tanaka Goh、Yasunaga Hideo
- 雑誌名
  
  Allergy
  
  巻: - 号: 6 ページ: 1598-1602
- DOI
  10.1111/all.16008
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Epidemiology of patients with lymphangioleiomyomatosis: A descriptive study using the national database of health insurance claims and specific health checkups of Japan2024
- 著者名/発表者名
  Kimura Yuya、Jo Taisuke、Hashimoto Yohei、Kumazawa Ryosuke、Ishimaru Miho、Matsui Hiroki、Yokoyama Akira、Tanaka Goh、Yasunaga Hideo
- 雑誌名
  
  Respiratory Investigation
  
  巻: 62 号: 3 ページ: 494-502
- DOI
  10.1016/j.resinv.2024.03.010
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Treatment strategies for pelvic organ prolapse and postoperative outcomes in older women with long‐term care needs: A population‐based retrospective cohort study2024
- 著者名/発表者名
  Wada Yoshimitsu、Takei Yuji、Sasabuchi Yusuke、Matsui Hiroki、Yasunaga Hideo、Kohro Takahide、Fujiwara Hiroyuki、Yamana Hayato
- 雑誌名
  
  International Journal of Gynecology & Obstetrics
  
  巻: - 号: 3 ページ: 1323-1329
- DOI
  10.1002/ijgo.15510
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] One-Year Functional Outcomes After Invasive Mechanical Ventilation for Older Adults With Preexisting Long-Term Care-Needs*2023
- 著者名/発表者名
  Ohbe Hiroyuki、Ouchi Kei、Miyamoto Yuki、Ishigami Yuichiro、Matsui Hiroki、Yasunaga Hideo、Sasabuchi Yusuke
- 雑誌名
  
  Critical Care Medicine
  
  巻: 51 号: 5 ページ: 584-593
- DOI
  10.1097/ccm.0000000000005822
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Adhesion barriers and intraperitoneal or uterine infections after cesarean section: A retrospective cohort study2022
- 著者名/発表者名
  Wada Yoshimitsu、Takahashi Hironori、Matsui Hiroki、Yasunaga Hideo、Fujiwara Hiroyuki、Sasabuchi Yusuke
- 雑誌名
  
  Surgery
  
  巻: 172 号: 6 ページ: 1722-1727
- DOI
  10.1016/j.surg.2022.08.029
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Development of Deep Learning Models for Predicting In-Hospital Mortality Using an Administrative Claims Database: Retrospective Cohort Study2022
- 著者名/発表者名
  Matsui Hiroki、Yamana Hayato、Fushimi Kiyohide、Yasunaga Hideo
- 雑誌名
  
  JMIR Medical Informatics
  
  巻: 10 号: 2 ページ: e27936-e27936
- DOI
  10.2196/27936
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Incidence of Sympathetic Ophthalmia after Inciting Events: A National Database Study in Japan.2021
- 著者名/発表者名
  Hashimoto Y, Matsui H, Michihata N, Ishimaru M, Yasunaga H, Aihara M, Kaburaki T.
- 雑誌名
  
  Ophthalmology
  
  巻: 129 号: 3 ページ: 344-352
- DOI
  10.1016/j.ophtha.2021.09.011
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[学会発表] 日本の高次元医療請求情報データの分散表現モデルの開発と臨床疫学研究への有効性の検討2023
- 著者名/発表者名
  松居宏樹、康永秀生
- 学会等名
  臨床疫学会第６回年次学術集会
- 関連する報告書
  2023 実績報告書
[学会発表] Word2Vecを用いた大規模医療データの次元縮減とマッチドコホート研究の効率化2022
- 著者名/発表者名
  松居宏樹
- 学会等名
  第42回医療情報学連合大会
- 関連する報告書
  2022 実績報告書
[学会発表] 深層学習で作成したリスクスコアを用いた治療効果比較研究2021
- 著者名/発表者名
  松居宏樹, 康永秀生
- 学会等名
  第41回医療情報学連合大会
- 関連する報告書
  2021 実績報告書
[備考] 資料公開
- URL
  https://researchmap.jp/multidatabases/multidatabase_contents/detail/272954/9a712df22b42f030c726b84c212af3af?frame_id=565960
- 関連する報告書
  2021 実績報告書

大規模医療介護ダミーデータベースの構築と精密医療への応用

研究代表者

松居 宏樹 東京大学, 大学院医学系研究科(医学部), 准教授 (70608794)

17,810千円 (直接経費: 13,700千円、間接経費: 4,110千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Epidemiology of severe childhood asthma in Japan: A nationwide descriptive study2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Epidemiology of patients with lymphangioleiomyomatosis: A descriptive study using the national database of health insurance claims and specific health checkups of Japan2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Treatment strategies for pelvic organ prolapse and postoperative outcomes in older women with long‐term care needs: A population‐based retrospective cohort study2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] One-Year Functional Outcomes After Invasive Mechanical Ventilation for Older Adults With Preexisting Long-Term Care-Needs*2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Adhesion barriers and intraperitoneal or uterine infections after cesarean section: A retrospective cohort study2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Development of Deep Learning Models for Predicting In-Hospital Mortality Using an Administrative Claims Database: Retrospective Cohort Study2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Incidence of Sympathetic Ophthalmia after Inciting Events: A National Database Study in Japan.2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] 日本の高次元医療請求情報データの分散表現モデルの開発と臨床疫学研究への有効性の検討2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Word2Vecを用いた大規模医療データの次元縮減とマッチドコホート研究の効率化2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層学習で作成したリスクスコアを用いた治療効果比較研究2021

著者名/発表者名

学会等名

関連する報告書

[備考] 資料公開

URL

関連する報告書

松居宏樹東京大学, 大学院医学系研究科(医学部), 准教授 (70608794)