2018 年度実施状況報告書

人工知能利用に伴うプライバシリスクの評価手法の開発

研究課題

研究課題/領域番号	17K12696
研究機関	国立研究開発法人理化学研究所
研究代表者	荒井ひろみ国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (20631782)
研究期間 (年度)	2017-04-01 – 2020-03-31
キーワード	プライバシ保護
研究実績の概要	個人に関する秘匿性の高いデータの取得及び利用においてデータのプライバシ保護は不可欠である．一方，このようなデータは個別化したデータサービスや医療などのための人工知能技術に頻繁に利用されており，プライバシの問題でデータの利用を妨げないことが望ましい．そのためにプライバシリスクを評価し，高リスクなデータ利用の際にはアクセス制限を行う等の工夫が必要である．これまで機械学習モデルや統計データ，学習モデルを用いた予測回答の開示の際に元のデータを推定されるリスクが指摘されてきた．本研究では様々なデータ利用手法についてこれらのリスクを評価する手法を開発し，データ開示の際のプライバシリスクを明らかにすることを目的とする．２年度の平成３０年度は，匿名化データ，統計データや機械学習モデルにおけるプライバシに関する研究開発を実施した．具体的には購買履歴などの系列データを分割し匿名化した場合に，匿名化した分割データを再収集した場合のプライバシリスクについて検討を行い，系列についての事前知識がある場合の再特定リスクを評価した．また，系列データを一般化を用いて匿名化した場合のプライバシリスクとデータ有用性のトレードオフの検証を行い様々なプライバシおよび有用性指標を検討した．さらに互いに相関が高い特徴量の組を含むデータを加工した場合のプライバシを検証した．特にそのような特徴量を含むデータを用いて分類機を学習した場合のプライバシリスクについて検討を行った．
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由今年度はプライバシリスク評価のための攻撃モデルおよびリスク評価について，データ加工方法や特徴量同士の相関をさらに考慮し研究を推進したが，当初の計画にあった実データによる検証が数例にとどまっており，より多様なデータで引き続き検証実験を行う計画である．
今後の研究の推進方策	今後も研究計画に沿って，引き続き多様なデータ加工下や外部知識の存在下におけるプライバシリスク評価方法の開発および実データによる評価実験を行い，成果の対外発表を目指す．プライバシの評価に用いることのできる適切な公開データが想定よりも少なく進捗にやや遅れが生じたが，理論やシミュレーションデータの利用も新たに想定し評価実験を行う計画である．
次年度使用額が生じた理由	初年度に都合により余剰が出た海外出張費について，今年度余剰分の半分程度支出を行った．来年度残りの半分について振替て利用する計画である．

研究成果
(2件)

すべて学会発表 (2件) (うち国際学会 1件)

[学会発表] Framework for privacy-preserving anomaly detection2019
- 著者名/発表者名
  Hiromi Arai
- 学会等名
  4TH FRANCO-JAPANESE CYBERSECURITY WORKSHOP
- 国際学会
[学会発表] 機械学習のセキュリティーとプライバシー2019
- 著者名/発表者名
  荒井ひろみ
- 学会等名
  computer security symposium 2018