研究課題/領域番号 |
15H02700
|
研究機関 | 東京大学 |
研究代表者 |
中川 裕志 東京大学, 情報基盤センター, 教授 (20134893)
|
研究分担者 |
菊池 浩明 明治大学, 総合数理学部, 専任教授 (20266365)
荒井 ひろみ 東京大学, 情報基盤センター, 助教 (20631782)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | プライバシー保護 / 差分プライバシー / サンプリング / 密度比推定 / Gibbs事後分布 |
研究実績の概要 |
(1)サンプリングデータを用いた場合の差分プライバシー:元々のデータをそのまま用いずに、類似のデータ分布を持つ仮想的な分布を密度比推定と呼ばれる方法を利用して生成することによってプライバシー保護する方法を提案した。ここで、元データからのサンプル率を下げると、所定のプライバシー保護強度を確保するために必要な差分プライバシーにおいて加算する雑音を低下させることができることをシミュレーションで確認した。つまり、当初の計画通りサンプリングによってプライバシー保護の強化と有用性の確保を両立できることを示した。 (2)差分プライバシーの拡張:差分プライバシーを包含するモデルとしてGibbs事後分布を提案した。しかし、従来の差分プライバシーでは加算される雑音はラプラス雑音の利用にほぼ限定されるなど汎用性に乏しかった。そこで、雑音加算された分布としてGibbs事後分布を用いることを提案した。元の分布と雑音加算された分布のKLダイバージェンスが有界となる条件を、利用するデータ数、Gibbs事後分布を規定する逆温度パラメターによって定義できた。この条件は概略、損失関数がL-リプシッツ、事前分布の対数が強凸であるとまとめられる。 (3)準同型性公開鍵暗号の応用:この暗号を用いるプライバシー保護技術の調査の為に,13th Annual Conference on Privacy, Security and Trust (PST)とIEEE 30th International Conference on Advanced Information Networking and Applications (AINA)に参加した.加法準同型性暗号を用いて,分散したデータベース間で任意のブール関数を適用した部分集合について決定木学習を行うアルゴリズムを論文に発表した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通り、サンプリングが情報検索の対象となるデータベースにおけるプライバシー保護に効果があることを実験的に立証できた。また、差分プライバシーの数理的モデルが必ずしも明確でなく、元データを雑音加算によって歪めることによる損失という問題の解決策として、Gibbs事後分布という概念を使えることを発見した。この発見を推進するために繰り越しを行った結果、Gibbs事後分布を規定するパラメターおよび事前分布と、損失の関係を明らかにするという進展を得、国際会議などで発表できた。
|
今後の研究の推進方策 |
当初の計画に沿って、情報検索において検索意図を秘匿する検索方式の検討、実装を行う。具体的には検索意図を表す検索質問が企業秘密であることが多く、その秘匿がとりわけ重要な特許検索における質問秘匿について検討する。さらに、プライバシー保護のための匿名化などの情報秘匿処理を破る強力な攻撃アルゴリズムを考案し、さらにそのような攻撃アルゴリズムに対してどれだけ情報秘匿ができるかを実験的に検証する。
|