2023 Fiscal Year Research-status Report
Research on clinical knowledge extraction infrastructure using real-world data derived from electronic medical records
Project/Area Number |
23K17001
|
Research Institution | National Center for Global Health and Medicine |
Principal Investigator |
石井 雅通 国立研究開発法人国立国際医療研究センター, 医療情報基盤センター, 医療情報基盤副センター長 (90787623)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | 症例レジストリ / ベイジアンネットワーク / 特徴量抽出 |
Outline of Annual Research Achievements |
令和5年度は実証実験の準備を実施した。先ずは研究対象データ取得のため、最新のJ-DREAMSデータベースから倫理審査にて承認を受けた研究計画書に沿って2018年から2023年3月までの匿名加工済みの65000症例について、患者基本情報、病名情報、処方情報、検査結果情報、病名情報及び観察項目情報を抽出した。ここで抽出されたデータ項目ごとにデータクレンジング作業を実施して異常値を除外したが、外れ値は次工程で評価するため除外対象とせずに、特に検査結果情報については検査項目ごとに母集団の基本統計値に加えて検査結果ごとの診断基準値と照らし併せることによりデータ特徴量の把握に努めた。 次に、J-DREAMS観察項目の収集に使用している診療録テンプレートから入力対象の観察項目を抽出して、観察項目間の意味関係について、診療イベント発生日と診療イベント内容などセットで意味をなすもの、診療イベント間に時系列関係があるもの、診療イベントを起因とした診断など因果関係があるもの、観察項目の粒度が細分化される包含関係があるものなどに整理して、観察項目間の異なる意味関係を識別可能とした。 また、J-DREAMSデータなどのレジストリを活用した糖尿病領域の後ろ向き研究に関する論文調査を実施した。各論文の研究仮説を踏まえて、J-DREAMSデータベースの抽出項目の中から、ベイジアンネットワークモデルにおける目的変数及び説明変数として利用可能な検査結果値等の観察項目を抽出して、観察項目ごとに仕分けを行った。また、eGFR値など利用可能な検査結果値等から新たに導出可能な観察項目についても検討を行った。更に検査結果値の時系列変化を特徴量として取り扱い可能とするため、検査実施日間の経過時間と検査値の変動量を算出する生成パターンについて整理を試みた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画書に従い、令和5年度の作業として計画していた、J-DREAMSデータベースからのデータ抽出、及び抽出した一次データの整理とそこからの新たな特徴量の導出、ベイジアンネットワーク上で検証を行うリサーチクエスチョンの整理について、予定通り実施できており、研究はおおむね順調に進展していると考えている。
|
Strategy for Future Research Activity |
今後の研究の推進にあたっては、引き続き研究計画書に従い、令和5年度に抽出したデータの更なるクレンジング作業を行うことでデータ品質を確保していく。また、観察項目から目的変数、説明変数として利用可能な新たな特徴量を増やす検討を継続していくことで、データプレパレーション工程を充実させていく。それらを踏まえて、令和6年度はベイジアンネットワークを利用した確率推論モデルを生成し、リサーチクエスチョンにもとづくデータシミュレーションが可能なモデルが生成できているか否かを感度分析等を用いて評価していき、モデル精度向上に取り組む。
|
Causes of Carryover |
令和5年度にベイジアンネットワークのための計算資源として、AI解析用ワークステーション(約65万円)を調達予定であったが、既設のベイジアンネットワーク利用のためのソフトウエアBayoLinkSの最新バージョンを当研究で活用するためには保守契約の継続(約22万円)が必要であり、そちらを優先して調達したため次年度使用額が発生した。 令和6年度に、次年度使用額と次年度助成金の合計額から、AI解析用ワークステーションの調達を実施する計画である。
|