2019 Fiscal Year Research-status Report
Developing a method for resolving bottleneck in analyses of national databases
Project/Area Number |
19K24222
|
Research Institution | University of Tsukuba |
Principal Investigator |
久米 慶太郎 筑波大学, 医学医療系, 助教 (70853191)
|
Project Period (FY) |
2019-08-30 – 2021-03-31
|
Keywords | 社会医学 / 匿名化 / ビッグデータ / 情報工学 |
Outline of Annual Research Achievements |
本研究では、多大な価値を有しているものの要配慮個人情報であるためにその利活用が限定的なものとなっている保健医療に関するデータベースについて、活用機会を拡大するための方法論の開発に、情報インフラストラクチャーの整備という観点から取り組んでいる。令和元年度の進展については、以下の3つの点に分けて記述する。 ①保健医療データのような要配慮個人情報を扱う研究では、研究計画が承認されてはじめてデータの内容を知ることができる。そのため研究開始後にはじめて認識する課題が存在する可能性がある。そのことを念頭に、保健医療データベースを用いた研究を行なっている研究者からヒアリングを行い、実際の現場で行われている個人情報の匿名化の手続きの状況調査を実施した。また、この過程で、データベースのパフォーマンスに関する新たな課題を発見した。② ①のヒアリングの過程で保険医療データのようなビッグデータの処理に必要とされる計算機性能を詳細に見積もるための情報収集もあわせて行なった。その後、計算機の導入において外的要因による想定外のトラブルが発生した。しかし、当初の計画より若干遅れたものの本年度末には計算機の準備が整った。③匿名化手法については、実際に研究機関で定められている取り扱いの要件、データの提供元である行政機関が定めている取り扱いの要件、法に定められている取り扱いの要件について調査し、匿名化処理にあたって考慮しなければならない要件・リスクについて評価を行なった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2019年における世界的なIntel社製CPU供給不足の影響を受け、当初研究計画において検討していた計算機に組み込む必要部品の納入時期が大幅に遅延するという予期せぬ出来事が発生し、その代替品を選定する必要があったため。 本課題で取り扱うような大規模なデータの処理のためには適切な処理能力を備えた計算機が必要である。課題申請時においては、2019年6月ごろに供給不足が解消されるとのニュースリリースがメーカーからなされていたが、研究開始時期にはそれが撤回され、2020年現在においても品薄が解消していない状況となっている。これを受けて、研究課題遂行に必要な処理能力を備え、かつ供給の見通しが立つ代替計算機の選定を行わざるを得なかった。
|
Strategy for Future Research Activity |
令和2年度は、レセプト情報・特定健診等情報データベース(NDB)を想定して構築した仮想のデータベースを対象として、令和元年度研究において得られた知見をもとに匿名化手法を適用・設計し、その妥当性を評価する。 またその際に、令和元年度の研究過程で認識した課題である、データベースを操作する際のパフォーマンスの問題を解決するために、適切なデータベース設計とパフォーマンスチューニングを行う。 また、当初研究計画において予定していた実際のNDBデータを用いた匿名化手法の評価についてであるが、NDBデータは厳格な管理下に置かれなければならない要配慮個人情報である。そのため、このデータを扱うためには研究施設に赴く必要がある。新型コロナウイルス感染症の拡大に伴う行動自粛が今後どのようになるか現時点では予測できず、当初の計画のままでは研究の円滑な遂行が困難になる可能性を否定できない。匿名化手法の評価は仮想データでも行えること、実際の個人情報を用いての匿名化手法の評価は本研究の核心を占めるわけではないということを考慮して、仮に長期間在宅のままでも研究が円滑に遂行できるようこれを行わないこととする。
|
Causes of Carryover |
海外(米国)から解析に必要なソフトウェアをダウンロード販売により入手する計画であり、当初仲介業者からは数日以内に納品可能との見積もり説明を受けていたが、発注後、米国からの知識の輸出と認識され、輸出コードの発給を待つ必要が生じたため。繰り越されたものは、当初の予定通りに発注を行いソフトウェアの購入に使用する予定である。
|