研究概要 |
データベースに含まれる情報を開示する際に,個人が特定されるような内容を除去する匿名化が求められることが多い.名前や電話番号など個人を特定するID属性に加え,性別や年齢など個人を特定するには至らないが組み合わせにより個人の特定が可能になる準ID属性が知られている.本研究では,準ID属性の組み合わせからプライバシー属性値への推論確率(IS確率)およびその逆方向の推論確率(SI確率)というあらたな匿名化制約を定式化する.さらに匿名化により生じる情報損失を定量的に評価するモデルを構築する.本年度は,これまで実装を行なつてきた匿名化アルゴリズムについて評価を行ない,5万人規模の匿名化を現実的な実行時間で行なえることを確認した.また情報損失の最小化目標として与えるコスト関数によって,実際に情報損失が制御できることを確認した.また本匿名化手法の形式的定義を整理し,既存手法との比較を行った. 一方,ソーシャルネットワークサービスでは,利用者の個人属性や写真等を一般に公開するか,Friendリンクでつながれた利用者にのみ公開するかといったプライバシー設定機能があるが,Facebookについて利用者が公開あるいは非公開としている項目と公開している個人属性の収集を行なった.プライバシースコアという情報の公開度を表わす指標と,個人属性の相関を求め,相関の強さの情報を用いて,個々の利用者に個人属性を用いてプライバシー設定の推薦を行なう手法を開発した.
|