2018 Fiscal Year Research-status Report
人工知能利用に伴うプライバシリスクの評価手法の開発
Project/Area Number |
17K12696
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
荒井 ひろみ 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (20631782)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | プライバシ保護 |
Outline of Annual Research Achievements |
個人に関する秘匿性の高いデータの取得及び利用においてデータのプライバシ保護は不可欠である.一方,このようなデータは個別化したデータサービスや医療などのための人工知能技術に頻繁に利用されており,プライバシの問題でデータの利用を妨げないことが望ましい.そのためにプライバシリスクを評価し,高リスクなデータ利用の際にはアクセス制限を行う等の工夫が必要である.これまで機械学習モデルや統計データ,学習モデルを用いた予測回答の開示の際に元のデータを推定されるリスクが指摘されてきた.本研究では様々なデータ利用手法についてこれらのリスクを評価する手法を開発し,データ開示の際のプライバシリスクを明らかにすることを目的とする. 2年度の平成30年度は,匿名化データ,統計データや機械学習モデルにおけるプライバシに関する研究開発を実施した.具体的には購買履歴などの系列データを分割し匿名化した場合に,匿名化した分割データを再収集した場合のプライバシリスクについて検討を行い,系列についての事前知識がある場合の再特定リスクを評価した.また,系列データを一般化を用いて匿名化した場合のプライバシリスクとデータ有用性のトレードオフの検証を行い様々なプライバシおよび有用性指標を検討した.さらに互いに相関が高い特徴量の組を含むデータを加工した場合のプライバシを検証した.特にそのような特徴量を含むデータを用いて分類機を学習した場合のプライバシリスクについて検討を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
今年度はプライバシリスク評価のための攻撃モデルおよびリスク評価について,データ加工方法や特徴量同士の相関をさらに考慮し研究を推進したが,当初の計画にあった実データによる検証が数例にとどまっており,より多様なデータで引き続き検証実験を行う計画である.
|
Strategy for Future Research Activity |
今後も研究計画に沿って,引き続き多様なデータ加工下や外部知識の存在下におけるプライバシリスク評価方法の開発および実データによる評価実験を行い,成果の対外発表を目指す.プライバシの評価に用いることのできる適切な公開データが想定よりも少なく進捗にやや遅れが生じたが,理論やシミュレーションデータの利用も新たに想定し評価実験を行う計画である.
|
Causes of Carryover |
初年度に都合により余剰が出た海外出張費について,今年度余剰分の半分程度支出を行った.来年度残りの半分について振替て利用する計画である.
|