研究課題/領域番号 |
16K00426
|
研究機関 | 一橋大学 |
研究代表者 |
白川 清美 一橋大学, 経済研究所, 准教授 (20755095)
|
研究分担者 |
相良 直哉 一橋大学, 経済研究所, 助教 (70433852)
|
研究期間 (年度) |
2016-10-21 – 2019-03-31
|
キーワード | 秘匿ルール / 組合せパターンのデータベース / 企業データ / 匿名化手法の確立 |
研究実績の概要 |
日本における公的統計調査の匿名データの提供は、総務省統計局の6調査と厚生労働省の1調査となっている。しかも、これらはすべて世帯を対象とした調査であり、企業を対象とした調査の匿名データは存在しない。そのため、現在提供されていない世帯調査や企業調査における問題がどこにあるかを、個票データを利用している国内外の研究者等にヒヤリングを行った。その結果、世帯調査においては、公的機関の担当者、または委託研究での個票データ利用のため、匿名データを利用する機会が少ないことが分かった。また、企業調査の匿名データ提供においては、企業の財務情報が公開されているため、その情報と個票データの内容が一致することによる特定が可能となるので、匿名化したデータの作成が困難であることが分かった。そのため、企業調査の匿名データを作成するには、公開されている財務関連データとは異なる形式(セグメント情報などの細分化、または資本金や売上高などの連続数値の統合)が不可欠であることが分かった。 次に、秘匿ルールからみた企業の特定では、特定に使用する統計量と度数別数値パターンを登録したデーターベースを構築した。これにより、特定のための数値を基に検索が可能となったので、個票データの値が特定できる場合とできない場合の閾値を見つけることが可能となった。 さらに、総務省が作成した「匿名データの作成・提供に係るガイドライン」の「匿名化処理の考え方」「匿名化処理の技法」及び「匿名化処理の目安」を見直しすることにより、匿名データ作成方法の確立が可能となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初予定では、公的統計(経済系調査個票データ)を取得し、実証分析を行う予定であったが、匿名化や秘匿ルールの適用する手法を確立することに専念した。 そのため、当初予定とは進捗が異なるが、適用手法が確立したことにより、おおむね順調に進展していると判断できる。
|
今後の研究の推進方策 |
平成28年度の取組みの継続により、秘匿ルールの適用や匿名化手法を試行し、平成29年度の後半には、実際の個票データに基づく匿名データの作成を行う。 なお、日本ですでに実績がある人口系の匿名データの擬似作成を行い、平成30年度に企業データの匿名データの擬似作成を行う予定である。 ※公的統計の匿名データ作成は、統計法により作成者が限定されているため、擬似的データの作成を行う。
|
次年度使用額が生じた理由 |
平成28年度の主な学会発表が9月に集中していたため、本プロジェクトが採択された10月25日にはすでに終了していた。 さらに、本年、匿名データ作成に掛かる研究を一橋大学経済研究所が総務省から受託したが、この研究内容が本研究と類似する部分があったため、経費を使用する必要がなく、大幅な経費の節約が図れたため。
|
次年度使用額の使用計画 |
平成29年度は、主に、オランダをはじめとして、欧州の各国統計局やミネソタ大学等の二次利用に関連した研究をしている大学と情報共有及び共同研究を行う。 さらに、企業の匿名データ作成のため、一般に公開されているデータを購入することと、公的統計との差異を模索するためのシステム作成を予定している。
|