研究実績の概要 |
診療報酬明細書データ(平成27年12月から平成28年11月提出分)、調剤レセプトデータ(平成27年12月から平成28年11月提出分)、平成26年度特定健康診査データ、平成26年度資格データが提供された。今年度提供されたデータ件数は、それぞれ、5,194,804件、4,756,521件、63,723件、228,954件であった。データ提供に際しては、自治体にて既に作成済みの匿名化ソフトを用いて、個人番号等はランダムな番号に変換した。大規模なデータの連結、突合、抽出を行うため、データベース言語であるSQL言語について習得し、データの連結作業等は自前で実施した。 平成29年3月時点で、蓄積された診療報酬明細書データは、平成24年4月から平成28年11月提出分(4年8ヵ月分)、25,334,467万件である。この蓄積データを用いて、糖尿病の服薬による医療費抑制効果の検証を実施する。近年報告されている医療費の予測にはTwo part modelを使用されており、その使用が適切であると判断した。このモデルは、First partで、医療費が「0円」または「それ以外」をロジスティック回帰で予測し、Second partとして、医療費が0円以外の部分について一般化線形モデルで予測を行う方法である。平成25年4月から平成28年3月分(3年分)の診療報酬明細書から、各対象者について「入院」、「入院外」、「調剤」の費用額の合計および追跡月数(B)を算出した。また、それらの値から追跡ひと月当たりの「入院費用額」、「入院外+調剤費用額」、「総費用額」を求めた。これらの分布を確認したところ、既に先行研究で確認されているように、0を含み、かつ、右に大きく裾を引く分布であった。正規分布およびガンマ分布の乱数を発生させ、実測の医療費との形を比較したところ、総医療費についてはガンマ分布を使用することが妥当であると考えられた。したがって、Two part modelのsecond partとしては、ガンマ分布、リンク関数としてlog を設定することした。
|