最終年度は、k-匿名化データと等価な情報をもつ度数分布表に関する統計開示制御手法の確立に取り組んだ。具体的には、表データにおける機密性の高いセル値を秘匿する問題を検討し、表データが内包する線形関係式から機密セルの値が攻撃者に復元されないように追加の2次秘匿処理を行う手法を開発した。ただし、元データの情報損失を最小限にするためには秘匿するセル数を最小化する必要がある。この最適化問題はNP困難として知られ、秘匿するセルの組み合わせを列挙するような単純なアルゴリズムの計算量は指数時間になってしまう。我々は、Benders分割の手法を採用し、秘匿するセル数の最小化に関する親問題と各機密セルの安全性検証に関する部分問題を交互に反復しつつ、多くの場合に最適解を効率よく求めるアルゴリズムを開発した。実際の公的調査データから作成した度数分布表を用い、現実的なサイズの度数分布表に対して、効率よく秘匿処理が行えることを実証的に検証した。さらにアルゴリズムを多次元表データに拡張することで、複数表データの差分による情報漏洩を防止するための基本技術を確立した。
|