2018 Fiscal Year Research-status Report

人工知能利用に伴うプライバシリスクの評価手法の開発

Research Project

Project/Area Number	17K12696
Research Institution	Institute of Physical and Chemical Research
Principal Investigator	荒井ひろみ国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (20631782)
Project Period (FY)	2017-04-01 – 2020-03-31
Keywords	プライバシ保護
Outline of Annual Research Achievements	個人に関する秘匿性の高いデータの取得及び利用においてデータのプライバシ保護は不可欠である．一方，このようなデータは個別化したデータサービスや医療などのための人工知能技術に頻繁に利用されており，プライバシの問題でデータの利用を妨げないことが望ましい．そのためにプライバシリスクを評価し，高リスクなデータ利用の際にはアクセス制限を行う等の工夫が必要である．これまで機械学習モデルや統計データ，学習モデルを用いた予測回答の開示の際に元のデータを推定されるリスクが指摘されてきた．本研究では様々なデータ利用手法についてこれらのリスクを評価する手法を開発し，データ開示の際のプライバシリスクを明らかにすることを目的とする．２年度の平成３０年度は，匿名化データ，統計データや機械学習モデルにおけるプライバシに関する研究開発を実施した．具体的には購買履歴などの系列データを分割し匿名化した場合に，匿名化した分割データを再収集した場合のプライバシリスクについて検討を行い，系列についての事前知識がある場合の再特定リスクを評価した．また，系列データを一般化を用いて匿名化した場合のプライバシリスクとデータ有用性のトレードオフの検証を行い様々なプライバシおよび有用性指標を検討した．さらに互いに相関が高い特徴量の組を含むデータを加工した場合のプライバシを検証した．特にそのような特徴量を含むデータを用いて分類機を学習した場合のプライバシリスクについて検討を行った．
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 今年度はプライバシリスク評価のための攻撃モデルおよびリスク評価について，データ加工方法や特徴量同士の相関をさらに考慮し研究を推進したが，当初の計画にあった実データによる検証が数例にとどまっており，より多様なデータで引き続き検証実験を行う計画である．
Strategy for Future Research Activity	今後も研究計画に沿って，引き続き多様なデータ加工下や外部知識の存在下におけるプライバシリスク評価方法の開発および実データによる評価実験を行い，成果の対外発表を目指す．プライバシの評価に用いることのできる適切な公開データが想定よりも少なく進捗にやや遅れが生じたが，理論やシミュレーションデータの利用も新たに想定し評価実験を行う計画である．
Causes of Carryover	初年度に都合により余剰が出た海外出張費について，今年度余剰分の半分程度支出を行った．来年度残りの半分について振替て利用する計画である．

Research Products
(2 results)

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

[Presentation] Framework for privacy-preserving anomaly detection2019
- Author(s)
  Hiromi Arai
- Organizer
  4TH FRANCO-JAPANESE CYBERSECURITY WORKSHOP
- Int'l Joint Research
[Presentation] 機械学習のセキュリティーとプライバシー2019
- Author(s)
  荒井ひろみ
- Organizer
  computer security symposium 2018