2021 年度実施状況報告書

個人の選好と報酬配分を考慮したパーソナルデータの健全で頑健な流通系構築に向けて

研究課題

研究課題/領域番号	21K19767
研究機関	京都大学
研究代表者	吉川正俊京都大学, 情報学研究科, 教授 (30182736)
研究分担者	曹洋京都大学, 情報学研究科, 特定助教 (60836344)
研究期間 (年度)	2021-07-09 – 2024-03-31
キーワード	パーソナルデータ / プライバシー保護 / 差分プライバシー / データ価値査定
研究実績の概要	国家によるGAFAなどのプラットフォーム大手に対する規制とは別に，各個人がパーソナルデータを管理，制御する手法を開発することにより，パーソナルデータを個人及び社会の資産として活用するための健全なデータ流通系を構築することを目的とする．流通系にパーソナルデータを取得しようとするする悪意を持った者が存在することを仮定する安全なデータ流通系の構築を目指す．各個人がパーソナルデータの種類ごとにプライバシー保護を望む程度に応じて，個人が提供したパーソナルデータに対する対価を得るための技術開発を行った．まず，パーソナルデータの真正性を保証するためにセキュアハードウェアとゼロ知識証明を利用した手法を開発した．また，IoTの発達と共に，多数の個人が各自所有するデバイスから繰り返し自動的に微少なパーソナルデータがデータ利用者により収集され機械学習を行う連合学習 (federated learning)がパーソナルデータ流通において重要な位置を占めると考えるため，連合学習を想定した研究開発も進めた．連合学習に基づくパーソナルデータ市場が成立するためには各個人に対して参加のインセンティブを与える必要がある．各個人が有するパーソナルデータを局所差分プライバシーで保護しながらインセンティブを付与する手法をオークション機構を用いて設計した．さらに，COVID-19感染履歴のようなパーソナルデータを考えた場合，感染履歴ありの方が感染履歴なしよりもプライバシー保護の強度を高める必要があることがわかる．このようにデータによりプライバシー保護強度が異なる点に着目し，それを差分プライバシーに取り入れた概念を開発した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由健全なパーソナルデータ流通系構築のためには，各個人はデータ利用者に対してデータの真正性を保証する必要がある．機密性の高いデータをSGX(Software Guard Extensions)エンクレーブと呼ばれるメモリ上の暗号的に保護された領域に格納することを可能にするIntel SGXなどの安全なハードウェアとゼロ知識証明などを用いて真正性を証明する方法を開発した．また，市場からのデータ購買者による裁定行動を防ぐために従来研究されてきた無裁定価格設定の概念を拡張し部分的無裁定価格設定を導入しその性質を明らかにした． FLにおけるクライアントに対する参加のインセンティブ付与とプライバシー保護の問題に取り組んだ．これら両方の問題を解決するために、局所差分プライバシに基づくFL用データ市場を設計し，ノイズの少ないプライベートモデルを取引するインセンティブを与える学習機能付きオークション機構と，最適なモデル更新のために局所的な勾配を正確な大域的勾配に集約するための集約機構を開発した．その上で，提案したフレームワークとメカニズムの有効性を実験により検証した．更に，従来の差分プライバシはすべてのデータのプライバシ保護程度は同じであると仮定していたが，実際の応用場面を考慮すると必ずしもその仮定は成立しないため，データによってプライバシ保護程度が異なるような非対称型の差分プライバシの概念を定式化しそれを実現するための具体的なプライバシ保護機構を与えた．
今後の研究の推進方策	複数のクライアントがパラメータサーバの協調により予測モデルを学習する連合学習（FL）において，クライアントの貢献度を評価するための原理的な尺度であるシャプレー値（SV）を計算する問題に取り組む．FLにおけるSVの評価には、生のモデルへのアクセスが必要でありクライアントの個人情報が信頼できないサーバに漏洩する可能性がある．クロスサイロFLにおけるSVの安全な評価の問題を検討し，同形暗号（Hemomorphic Encryption: HE）を用いたベースライン解決策と効率的な評価プロトコルを研究する．また，データ解析サーバが信頼できない場合に各クライアント自身がデータに確率的な雑音を加える局所差分プライバシがあるがデータ解析結果の性能が低下することが知られている．それを解決するためのシャッフリングモデルを改良し一般化する新たなモデルを開発し，個人化されたプライバシー保証のみでなく，そのプライバシ，有用性の既存のシャッフリングモデルとの関連性を数学的に示すことを目標とする．更に，実世界のデータを用いた実験を行い，連合学習と呼ばれる近年注目されている機械学習の枠組において，提案のモデルのプライバシ・有用性の観点での優位性を検証する．
次年度使用額が生じた理由	COVID-19の終息が見込めず海外を含む出張を行えなかったため旅費を使用しなかった．また，博士後期課程学生が学術振興会特別研究員に採用されたため，RA雇用分の人件費を使用しなかった．本年度は，国際会議発表のための海外出張旅費を多く使用する予定である．

研究成果
(2件)

すべて 2022 2021

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (1件) (うち国際学会 1件)

[雑誌論文] PCT-TEE: Trajectory-based Private Contact Tracing System with Trusted Execution Environment2022
- 著者名/発表者名
  Kato Fumiyuki、Cao Yang、Yoshikawa Masatoshi
- 雑誌名
  
  ACM Transactions on Spatial Algorithms and Systems
  
  巻: 8 ページ: 1～35
- DOI
  10.1145/3490491
- 査読あり
[学会発表] Preventing Manipulation Attack in Local Differential Privacy using Verifiable Randomization Mechanism2021
- 著者名/発表者名
  Fumiyuki Kato, Yang Cao and Masatoshi Yoshikawa
- 学会等名
  The 35th Annual IFIP WG 11.3 Conference on Data and Applications Security and Privacy (DBSec 2021)
- 国際学会

2021 年度 実施状況報告書

個人の選好と報酬配分を考慮したパーソナルデータの健全で頑健な流通系構築に向けて

研究代表者

吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] PCT-TEE: Trajectory-based Private Contact Tracing System with Trusted Execution Environment2022

著者名/発表者名

雑誌名

DOI

[学会発表] Preventing Manipulation Attack in Local Differential Privacy using Verifiable Randomization Mechanism2021

著者名/発表者名

学会等名

2021 年度実施状況報告書

吉川正俊京都大学, 情報学研究科, 教授 (30182736)