個票データの開示とプライバシー保護に関する統計的分析および我が国における実際
Project/Area Number |
09206104
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | Yokohama National University |
Principal Investigator |
加納 悟 横浜国立大学, 経済学部, 教授 (50114971)
|
Co-Investigator(Kenkyū-buntansha) |
李 志東 長岡技術科学大学, 工学部, 助教授 (80272871)
大塚 英作 横浜国立大学, 経営学部, 助教授 (20194201)
渡辺 努 日本銀行, 調査統計局, 調査役
岡村 與子 富山大学, 経済学部, 助教授 (20281016)
|
Project Period (FY) |
1997
|
Project Status |
Completed (Fiscal Year 1997)
|
Budget Amount *help |
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 1997: ¥2,500,000 (Direct Cost: ¥2,500,000)
|
Keywords | 家計調査 / キ-変数 / 個体識別 / 予測開示 |
Research Abstract |
前年度の理論的考察に基づき、今年度は実際のデータセットのマイクロレベルデータが公表可能であるか否かを検討した。データセットは主として家計調査を用い、個体識別と予測識別の二つの観点からリスクの評価を行った。その結果以下のような結論が得られた。 1.「家計調査報告」から「地域コード」や「世帯人数」など8つの変数をキ-変数として選択した。それらをすべて組み合わせると、何らかの秘匿手段を講じなければ公表できないことがわかる。 2.秘匿手段としてよく用いられるtop-coding,bottom-coding,そしてlocal suppressionなどをキ-変数に適用したが、その秘匿効果は大きくない。 3.キ-変数のいくつかを完全に削除することを考えた結果、データセットが公表可能となるには、「世帯人数」を含め少なくとも2つのキ-変数を削除すべきであることがわかる。 4.適当な抽出率で部分標本を採る。ある一定の標本数を確保するためには、たとえ部分標本を採ったにしても何らかの秘匿措置を講じなければならないことがわかる。 5.結局安全なデータセットを得るためには、標本率を0.5とし、「世帯人数」もしくは2変数を同時に削除するべきであることがわかる。 6.データセットに識別開示の危険性がないことが確認された後、「所得」、「土地・家屋に対する借金の返済」などの5変数について予測開示の危険性を検討した。その結果、すべての変数について予測開示の心配がないことがわかった。 以上の実験結果をまとめ、キ-変数のうち「世帯人数」を削除し、抽出率50%の部分標本を採ることにより、家計調査の結果は個体識別の心配も予測開示の心配もなく公表可能であるという結論を得た。
|
Report
(1 results)
Research Products
(5 results)