• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Research on clinical knowledge extraction infrastructure using real-world data derived from electronic medical records

Research Project

Project/Area Number 23K17001
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionNational Center for Global Health and Medicine

Principal Investigator

石井 雅通  国立研究開発法人国立国際医療研究センター, 医療情報基盤センター, 医療情報基盤副センター長 (90787623)

Project Period (FY) 2023-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Keywords症例レジストリ / ベイジアンネットワーク / 特徴量抽出 / 臨床レジストリ / 確率推論 / 患者状態モデル
Outline of Research at the Start

本研究は、電子カルテから臨床情報を収集することで作成されたデータベース(臨床レジストリ)の利活用を促進することを目指しています。臨床レジストリにベイジアンネットワーク技術を適用して、臨床レジストリを反映した患者状態モデルを新たに生成することによって、データベース研究者による確率推論を用いたシミュレーションを可能とする環境を研究開発します。これにより、データベース研究者は自身のリサーチクエスチョンに基づく研究が臨床レジストリを用いて実施可能かをデータ利用契約前に確認できるようになります。

Outline of Annual Research Achievements

令和5年度は実証実験の準備を実施した。先ずは研究対象データ取得のため、最新のJ-DREAMSデータベースから倫理審査にて承認を受けた研究計画書に沿って2018年から2023年3月までの匿名加工済みの65000症例について、患者基本情報、病名情報、処方情報、検査結果情報、病名情報及び観察項目情報を抽出した。ここで抽出されたデータ項目ごとにデータクレンジング作業を実施して異常値を除外したが、外れ値は次工程で評価するため除外対象とせずに、特に検査結果情報については検査項目ごとに母集団の基本統計値に加えて検査結果ごとの診断基準値と照らし併せることによりデータ特徴量の把握に努めた。
次に、J-DREAMS観察項目の収集に使用している診療録テンプレートから入力対象の観察項目を抽出して、観察項目間の意味関係について、診療イベント発生日と診療イベント内容などセットで意味をなすもの、診療イベント間に時系列関係があるもの、診療イベントを起因とした診断など因果関係があるもの、観察項目の粒度が細分化される包含関係があるものなどに整理して、観察項目間の異なる意味関係を識別可能とした。
また、J-DREAMSデータなどのレジストリを活用した糖尿病領域の後ろ向き研究に関する論文調査を実施した。各論文の研究仮説を踏まえて、J-DREAMSデータベースの抽出項目の中から、ベイジアンネットワークモデルにおける目的変数及び説明変数として利用可能な検査結果値等の観察項目を抽出して、観察項目ごとに仕分けを行った。また、eGFR値など利用可能な検査結果値等から新たに導出可能な観察項目についても検討を行った。更に検査結果値の時系列変化を特徴量として取り扱い可能とするため、検査実施日間の経過時間と検査値の変動量を算出する生成パターンについて整理を試みた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画書に従い、令和5年度の作業として計画していた、J-DREAMSデータベースからのデータ抽出、及び抽出した一次データの整理とそこからの新たな特徴量の導出、ベイジアンネットワーク上で検証を行うリサーチクエスチョンの整理について、予定通り実施できており、研究はおおむね順調に進展していると考えている。

Strategy for Future Research Activity

今後の研究の推進にあたっては、引き続き研究計画書に従い、令和5年度に抽出したデータの更なるクレンジング作業を行うことでデータ品質を確保していく。また、観察項目から目的変数、説明変数として利用可能な新たな特徴量を増やす検討を継続していくことで、データプレパレーション工程を充実させていく。それらを踏まえて、令和6年度はベイジアンネットワークを利用した確率推論モデルを生成し、リサーチクエスチョンにもとづくデータシミュレーションが可能なモデルが生成できているか否かを感度分析等を用いて評価していき、モデル精度向上に取り組む。

Report

(1 results)
  • 2023 Research-status Report

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi