研究課題/領域番号 |
24650064
|
研究機関 | 東京大学 |
研究代表者 |
中川 裕志 東京大学, 情報基盤センター, 教授 (20134893)
|
研究分担者 |
佐藤 一誠 東京大学, 情報基盤センター, 助教 (90610155)
|
キーワード | プライバシー保護 / データマイニング / 差分プライバシー / ビッグデータ / 個人情報 / データベース / 匿名化 / 相関 |
研究概要 |
ビッグデータの重要性が認識されるにつれて、その重要な部分でありかつビジネスでも役立つパーソナルデータの利活用に注目が集まってきている。たとえば、病院における感染症に関するデータ、公共交通における種々の事故情報、企業における販売、流通に関する情報などである。これらの生データは個人情報保護、機関毎の機密性、守秘性の観点から公開できない。しかし、複数機関がこれらのデータを部分的にせよ機関を跨って参照できれば、公共安全、企業ないし業界の発展に資する例は枚挙にいとまがない。たとえば、複数の病院のインフルエンザ患者の来院数の時間的変化が小さな時間遅れで参照できれば、流行の予兆検知、ワクチン量の適正な配分などが可能になるであろう。 上記の目的を実現する技術として2000年代に入ってプライバシー保護データマイニング(PPDM)の研究が盛んになってきた。PPDMのひとつである差分プライバシー技術はデータベースへの検索質問に対する結果にその都度異なる雑音を加算する。データベースを改変する手間が不要で、バイアスもなく有望な方法である。ただし、差分プライバシーにおいてはデータベースのレコード間に相関がある場合の分析があまり進んでいなかった。本研究では、相関がある場合に従来の差分プライバシーを適用した場合、データ入手を狙う攻撃者が相関に関する背景知識を少なく持っているほうが、流出する情報が大きいという直感に反する状況を明らかにし、この状況を改善するために背景知識も考慮したベイズ型差分プライバシーの数理モデルを確立した。この数理モデルにおいて情報漏洩の確率を与えられた閾値以下にする加算すべきラプラス雑音のパラメタを求める近似的アルゴリズムを示した。 さらに雑音加算などの方法が誘発する問題についても検討し、パーソナルデータを利活用する際の問題点を明らかにした。
|