研究概要 |
機械学習においてデータに個人情報が含まれる場合には、プライバシの侵害を考慮し, 解析の前にデータの匿名化を行うなどの処理が必要となる. 一般に, 匿名性とデータ有用性の間にはトレードオフの関係があることが知られているが, 匿名化によりデータ有用性がどう変化するかについての解析はほとんどなされていない. H25年度はプライバシ保護を目的としてデータに加えた変化をロバスト最適化における摂動と解釈することによって、 代表的な予測モデルである線形回帰を対象とし, この摂動について頑健な線形回帰をロバスト最適化により求めたときの, 予測の期待損失を実験的に評価した. 実験の結果, 匿名性と精度の関係は必ずしもトレードオフとはならず, 匿名性を高めた場合でも、期待損失が必ずしも増大しないことがわかった。
|