2015 Fiscal Year Annual Research Report
匿名化が誘発する濡れ衣現象のモデル化と最適化による解消法
Project/Area Number |
26540041
|
Research Institution | The University of Tokyo |
Principal Investigator |
中川 裕志 東京大学, 情報基盤センター, 教授 (20134893)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 一誠 東京大学, 新領域創成科学研究科, 講師 (90610155)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 情報基礎 / アルゴリズム / 個人情報 / プライバシー保護 / 匿名化 |
Outline of Annual Research Achievements |
インターネット上のデータや諸機関が収集したビッグデータ利用において個人特定をできることがプライバシー保護の観点から問題であることが指摘され、プライバシー保護データマイニングの分野で情報の精度をあえて落とすk-匿名化手法の研究が進んできた。一方、個人が自分自身が関与しないにもかかわらず否定的な事情を疑われること、すなわち濡れ衣の被疑はこれまでプライバシー保護データマイニング分野では見過ごされてきた問題である。本研究では、このような問題意識から匿名化による情報精度の低下が、当事者にとって否定的な事象の濡れ衣の被疑を誘発する現象の数理モデルを明らかにし、対策を確立した。 まず、濡れ衣誘発のメカニズムに関して主観確率の非線形性に着目した。例えば、就職活動中の学生が応募している企業の採用担当者の立場で考えてみると、応募者が消費者金融店舗に出入りした場合は、就職後会社に与える損害額の主観的期待値が新たな応募者を調査する費用より高ければ、濡れ衣を疑うであろう。 そこで、k-匿名化が誘発する濡れ衣を軽減する方法として、精度を粗くした疑似識別子が同一のk人のグループの中にできるだけ少ない人数が問題のある行動をしているようなアルゴリズムを構築した。これは、前年度構築した位置情報を対象にしたアルゴリズムを、カテゴリー属性を持つ情報にまで拡大した一般的なアルゴリズムである。アルゴリズムはk人のグループ内の問題のある人の数を最小化する最適化問題として定式化したため、目的関数が必要である。目的関数としては情報損失を用い、探索はトップダウン型とした。評価実験の結果、既存のモンドリアン手法に対して、情報損失の若干の低下はあったものの、濡れ衣を疑う主観確率を50%から80%程度減少させることができた。
|
Research Products
(5 results)