研究課題/領域番号 |
16K00426
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
ウェブ情報学・サービス情報学
|
研究機関 | 一橋大学 |
研究代表者 |
白川 清美 一橋大学, 経済研究所, 准教授 (20755095)
|
研究分担者 |
相良 直哉 一橋大学, 経済研究所, 助教 (70433852)
|
研究期間 (年度) |
2016-10-21 – 2019-03-31
|
キーワード | 統計的開示抑制 / トップ・ボトムコーディング / 持ち出し審査 / 基本統計量 / 合成データ / オープンデータ / オンサイト施設 |
研究成果の概要 |
本研究では、企業の特定に使用する統計量と度数別数値パターンを登録したデータベースを構築した。これにより、特定のための数値を基に検索が可能となったので、元データの値が特定できる場合とできない場合の閾値を見つけることが可能となった。さらに、企業調査である科学技術研究調査のミクロデータを使用し、最大値・最小値などの統計量や度数を変数ごとに作表した。また、最大値・最小値を秘匿するためのトップ・ボトムコーディングの境界値の分析を行い、どの様にそれぞれの境界値を決定すればよいかの回帰モデルを作成した。これらの検証により、研究者に有用な匿名化技法の明確化が可能となった。
|
自由記述の分野 |
公的統計二次利用
|
研究成果の学術的意義や社会的意義 |
学術的意義は、二次利用推進を図るため、企業調査における匿名化技法の研究であり、攪乱手法による有用性を損なわない秘匿性向上の検証である。特に、基本統計量のデータベース作成とその機能の活用により、トップ・ボトムコーディング、リコーディング(区分統合)、センシティブルールの閾値の設定など、より多くのシミュレーションに基づいた匿名化を可能とすることである。 社会的意義は、①企業情報の利用を要望している研究者等の有用性が向上する。②数値パターンに基づいた基本統計量のデータベースを利用し、匿名化に有用な手法を活用することにより、データの匿名化や作成した合成データが研究者等の利便性を格段に向上させる、である。
|