研究課題
基盤研究(C)
本研究では,学習データとして利用するための表形式のデータの人工生成法の研究を行う.データ生成では,敵対的生成ネットワーク(GAN)を使った手法が有効であるが,本研究で注目している異常値や特異値などのレアデータにおいてプライバシーリスクが指摘されている.そのリスクを回避する手法として差分プライバシー(DP)が有力であるが,レアデータを保護するためには加えるべきノイズを大きくしなければならず,データの価値が大きく損なわれる.そこで本研究では,レアデータの価値とプライバシーを両立できる新しいデータ生成技術の研究開発を行う.