研究課題/領域番号 |
20K18973
|
研究機関 | 独立行政法人国立病院機構本部(総合研究センター) |
研究代表者 |
井上 紀彦 独立行政法人国立病院機構本部(総合研究センター), 診療情報分析部, 主任研究員 (60867068)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | DPC / 小児 / 多変量解析 / データベース / リアルワールドデータ / 先天性心疾患 / ビッグデータ / 心臓外科 |
研究実績の概要 |
小児の先天性心疾患リスクスコアモデル構築のため、データセット作成に必要なプログラム作成と、プロトタイプモデルの作成を行った。 全国規模の診療報酬請求に用いられているDPCデータベースに記録された2010年度から2016年度の患者データから、疾病及び関連保健問題の国際統計分類ICD-10のコードやDPCコードを用いて先天性心疾患による入院を特定し、患者基本情報と診療行為のデータの抽出を行った。各患者の先天性心疾患及び合併症の分類は、WHOの「疾病及び関連保健問題の国際統計分類ICD-10」に基づき、診療行為は診療報酬コードに基づいて手術名や人工心肺などの各種診療行為を特定し、それぞれ各患者との紐付けを行ってデータセットの作成を行った。これらデータセット作成に関わる作業はデータベース言語SQL及び、統計解析環境Rでプログラムを作成した。 先天性心疾患の病名で入院しており、実際に手術していた症例は3万人程度であった。作成したデータセットに対して一般化加法モデルなどの多変量解析の手法によって死亡と関連のある因子を探索・予測モデル作成・予測能の検証を行った。多変量解析モデルによる予測能を検証したところ、ROC曲線(Receiver Operatorating Characteristic curve、受信者動作特性曲線)の曲線下面積AUC(Area Under the Curve)は0.8で良好であった。 また、本研究で培われたDPCデータベースのデータ抽出、データセット作成、解析のプログラムによるフローを応用して共同研究を行ない、原著論文2本受理と学会発表2件を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度予定のデータセット作成の部分が特に問題なく完了している。DPCデータベースに毎年発生するデータの追加と更新にも対応できるようデータ抽出フロー及び抽出プログラムを設計しており、概ね順調に進展していると考えられる。 データセット作成に関しては、DPCデータの患者基本情報と診療行為情報を取得したのち、外れ値のクリーニング、欠測値補間、集計を可能な限り自動化しており、他の研究においても応用の効くプログラムを作成した。 DPCデータベースには診療行為の実施情報を格納しているEFファイルは、臨床の診療状況を反映した1日、7日間、14日間、30日間などの、実際の臨床現場でもよく目にする処方パターンを反映した入力が為されている。このため、解析にはこれらの様々な入力パターンから統計解析に用いることができる形へと、データの正規化を行う必要が生じる。正規化したデータセット作成のため、各診療行為の実施有無、開始日、実施期間、累積使用量、平均使用量、薬剤の有効成分の単位用量などを一括して変換するためのデータ処理フローをR言語を用いて作成した。 このデータ処理フローはDPCデータを用いる他の研究にも利用することが可能なため、本研究のみならず、他の研究テーマにおいても効率化を進める事ができると考えられる。
|
今後の研究の推進方策 |
今後、さらにDPCデータベースの更新に合わせてデータを追加し、より精度の高いデータセットおよび解析モデルを作成する。その後、予測モデルの作製および解析を進めていく。
|
次年度使用額が生じた理由 |
新型コロナウイルス感染症による物流の遅れにより納期が延びていることと、学会が中止や延期になったため。
|