本研究課題は個人に関する秘匿性の高いデータの取得及び利用におけるデータのプライバシリスクを研究対象とする。令和4年度は人工知能利用におけるプライバシーリスクにおける公平性及びトレースデータの匿名化のプライバシーリスクについて検討を行った。 本研究課題において、画像やトレースなど様々なデータ形式におけるプライバシー保護手法とそのリスクについて検証してきた。画像などの高次元でかつ構造を持つデータの有用性を維持しながらプライバシーリスクを下げるため、特徴抽出や次元削減などの工夫が必要である。そこで顔画像を対象に非負値行列因子分解を用いた匿名化などについて検討を行った。 また、利活用におけるデータの流れを考慮したプライバシーリスクについての検討も行った。適切な非パーソナルデータ化のために匿名化や抽象化における想定されるプライバシーリスクについて整理し、説明責任のあり方を議論した。また、情報の流れについて整理・記述する方法の開発及び調査研究を実施した。文脈完全性をもとにプライバシーポリシーから情報の流れを記述するパラメータを抽出する方法を開発した。 また、データの偏りの学習結果への影響について検討した.データ提供者の人種や性別などのセンシティブ特徴の値に依存して機械学習モデルによる判断の結果が異なる場合がある。顔認証において学習データの偏りによって認証精度の偏りが生じることや、テストセットの偏りによって評価値が変化することを確認した。
|