研究課題/領域番号 |
23K17001
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 国立研究開発法人国立国際医療研究センター |
研究代表者 |
石井 雅通 国立研究開発法人国立国際医療研究センター, 医療情報基盤センター, 医療情報基盤副センター長 (90787623)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 症例レジストリ / ベイジアンネットワーク / 特徴量抽出 / 臨床レジストリ / 確率推論 / 患者状態モデル |
研究開始時の研究の概要 |
本研究は、電子カルテから臨床情報を収集することで作成されたデータベース(臨床レジストリ)の利活用を促進することを目指しています。臨床レジストリにベイジアンネットワーク技術を適用して、臨床レジストリを反映した患者状態モデルを新たに生成することによって、データベース研究者による確率推論を用いたシミュレーションを可能とする環境を研究開発します。これにより、データベース研究者は自身のリサーチクエスチョンに基づく研究が臨床レジストリを用いて実施可能かをデータ利用契約前に確認できるようになります。
|
研究実績の概要 |
令和5年度は実証実験の準備を実施した。先ずは研究対象データ取得のため、最新のJ-DREAMSデータベースから倫理審査にて承認を受けた研究計画書に沿って2018年から2023年3月までの匿名加工済みの65000症例について、患者基本情報、病名情報、処方情報、検査結果情報、病名情報及び観察項目情報を抽出した。ここで抽出されたデータ項目ごとにデータクレンジング作業を実施して異常値を除外したが、外れ値は次工程で評価するため除外対象とせずに、特に検査結果情報については検査項目ごとに母集団の基本統計値に加えて検査結果ごとの診断基準値と照らし併せることによりデータ特徴量の把握に努めた。 次に、J-DREAMS観察項目の収集に使用している診療録テンプレートから入力対象の観察項目を抽出して、観察項目間の意味関係について、診療イベント発生日と診療イベント内容などセットで意味をなすもの、診療イベント間に時系列関係があるもの、診療イベントを起因とした診断など因果関係があるもの、観察項目の粒度が細分化される包含関係があるものなどに整理して、観察項目間の異なる意味関係を識別可能とした。 また、J-DREAMSデータなどのレジストリを活用した糖尿病領域の後ろ向き研究に関する論文調査を実施した。各論文の研究仮説を踏まえて、J-DREAMSデータベースの抽出項目の中から、ベイジアンネットワークモデルにおける目的変数及び説明変数として利用可能な検査結果値等の観察項目を抽出して、観察項目ごとに仕分けを行った。また、eGFR値など利用可能な検査結果値等から新たに導出可能な観察項目についても検討を行った。更に検査結果値の時系列変化を特徴量として取り扱い可能とするため、検査実施日間の経過時間と検査値の変動量を算出する生成パターンについて整理を試みた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画書に従い、令和5年度の作業として計画していた、J-DREAMSデータベースからのデータ抽出、及び抽出した一次データの整理とそこからの新たな特徴量の導出、ベイジアンネットワーク上で検証を行うリサーチクエスチョンの整理について、予定通り実施できており、研究はおおむね順調に進展していると考えている。
|
今後の研究の推進方策 |
今後の研究の推進にあたっては、引き続き研究計画書に従い、令和5年度に抽出したデータの更なるクレンジング作業を行うことでデータ品質を確保していく。また、観察項目から目的変数、説明変数として利用可能な新たな特徴量を増やす検討を継続していくことで、データプレパレーション工程を充実させていく。それらを踏まえて、令和6年度はベイジアンネットワークを利用した確率推論モデルを生成し、リサーチクエスチョンにもとづくデータシミュレーションが可能なモデルが生成できているか否かを感度分析等を用いて評価していき、モデル精度向上に取り組む。
|