データの利活用が我々の生活を豊かにしている背景で,プライバシ問題が立ちはだかっている. そこで,データ利活用とプライバシ保護のバランスを取るための手法として,データにノイズを加える差分プライバシ(DP)が注目を浴びている.しかし,DPが登場した2006年以来,実世界への応用は数える程である.これは,DPが強力なプライバシ保証を与えるために多くのノイズを加えるなど制限を加え,データの有用性を犠牲にしているからである.そこで,本研究では,強力な差分プライバシ保証を保ったまま,有用性を上げる方法を探る.本年度は,データ分析における設定について,分散的データ分析と中央的データ分析の二つのデータ分析についてそれぞれ考える.分散的データ分析では,各ユーザーのデータが分散的に分析される設定を考える.この設定では,shuffling modelと呼ばれるDPの適用手法によって,有用性が高いデータが出力できる.本研究では,shuffling modelでは,分析において重要なクエリ操作であるフィルタリング操作ができないことを明らかにした.そしてそれを解決するshuffling modelの修正法を提案した.その効率の良い修正手法を提案し,有用性の損失がなくフィルタリング操作を可能にした.中央的データ分析においては,信頼できる機関が収集したデータセットを信頼できない第三者が分析する設定を考える.この設定での有力なDPの適用手法は,DPの制約下での深層生成モデルによる擬似データの生成である.本研究は,軌跡データを生成する手法が存在せず,またDPの単純な適用では質の低い擬似データが生成されることに着目する.そこで,DPの性質に基づいて新しい軌跡情報のための深層生成モデルを提案し,実際に 既存研究と比べて質の高い擬似データが生成できることを示した.
|