研究実績の概要 |
本研究では,診療報酬データベースに対して,疫学研究に適したデータモデルの構築を標榜していた.診療報酬データベースとして,今年度はNDBサンプリングデータセット(NDB-SD)を用いた.NDB-SDに対して本手法を適用し, NDB-SDを用いて実施された疫学研究等を調査し, 出現頻度の高いデータ項目を反映することを目指した.結果的に, 既存データベースにマスターデータ等を加えて検索性を高めたデータモデル, 患者単位でデータが統合を行ったデータモデル, 傷病名等の利用頻度が高いデータ項目に特化したデータモデルの3種類のデータモデルを作成した.また併せて, NDB-SD提供時のデータからデータモデルを構築するまでの工程を自動化した. また,定量的な検証として,患者人数を集計し, 検索速度とクエリの複雑性についてどの程度の向上がみられるか評価を行った.結果的に, 既存のデータベースでの集計と比較して, 本研究で構築したデータモデルは処理速度とクエリ複雑度に関して約5~6倍のパフォーマンスを示した. 既存データベースをそのまま用いる場合と比較して仮説生成のための探索的解析の効率が高まっていることが定量的に示された.また仮説検証時のデータモデル生成に関しても, 予め自動生成された患者単位でデータ統合を行ったデータモデルに対して必要なデータを追加していくことで事足りるため, 検証用データモデルの生成負荷が逓減されているといえる.最後に,実用上の検証として,本システムを利用して産科に関する疫学研究を実施し,それらの成果を論文化した.
|