2021 Fiscal Year Research-status Report
個人の選好と報酬配分を考慮したパーソナルデータの健全で頑健な流通系構築に向けて
Project/Area Number |
21K19767
|
Research Institution | Kyoto University |
Principal Investigator |
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
|
Co-Investigator(Kenkyū-buntansha) |
曹 洋 京都大学, 情報学研究科, 特定助教 (60836344)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | パーソナルデータ / プライバシー保護 / 差分プライバシー / データ価値査定 |
Outline of Annual Research Achievements |
国家によるGAFAなどのプラットフォーム大手に対する規制とは別に,各個人がパーソナルデータを管理,制御する手法を開発することにより,パーソナルデータを個人及び社会の資産として活用するための健全なデータ流通系を構築することを目的とする.流通系にパーソナルデータを取得しようとするする悪意を持った者が存在することを仮定する安全なデータ流通系の構築を目指す.各個人がパーソナルデータの種類ごとにプライバシー保護を望む程度に応じて,個人が提供したパーソナルデータに対する対価を得るための技術開発を行った. まず,パーソナルデータの真正性を保証するためにセキュアハードウェアとゼロ知識証明を利用した手法を開発した.また,IoTの発達と共に,多数の個人が各自所有するデバイスから繰り返し自動的に微少なパーソナルデータがデータ利用者により収集され機械学習を行う連合学習 (federated learning)がパーソナルデータ流通において重要な位置を占めると考えるため,連合学習を想定した研究開発も進めた.連合学習に基づくパーソナルデータ市場が成立するためには各個人に対して参加のインセンティブを与える必要がある.各個人が有するパーソナルデータを局所差分プライバシーで保護しながらインセンティブを付与する手法をオークション機構を用いて設計した.さらに,COVID-19感染履歴のようなパーソナルデータを考えた場合,感染履歴ありの方が感染履歴なしよりもプライバシー保護の強度を高める必要があることがわかる.このようにデータによりプライバシー保護強度が異なる点に着目し,それを差分プライバシーに取り入れた概念を開発した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
健全なパーソナルデータ流通系構築のためには,各個人はデータ利用者に対してデータの真正性を保証する必要がある.機密性の高いデータをSGX(Software Guard Extensions)エンクレーブと呼ばれるメモリ上の暗号的に保護された領域に格納することを可能にするIntel SGXなどの安全なハードウェアとゼロ知識証明などを用いて真正性を証明する方法を開発した. また,市場からのデータ購買者による裁定行動を防ぐために従来研究されてきた無裁定価格設定の概念を拡張し部分的無裁定価格設定を導入しその性質を明らかにした. FLにおけるクライアントに対する参加のインセンティブ付与とプライバシー保護の問題に取り組んだ.これら両方の問題を解決するために、局所差分プライバシに基づくFL用データ市場を設計し,ノイズの少ないプライベートモデルを取引するインセンティブを与える学習機能付きオークション機構と,最適なモデル更新のために局所的な勾配を正確な大域的勾配に集約するための集約機構を開発した.その上で,提案したフレームワークとメカニズムの有効性を実験により検証した. 更に,従来の差分プライバシはすべてのデータのプライバシ保護程度は同じであると仮定していたが,実際の応用場面を考慮すると必ずしもその仮定は成立しないため,データによってプライバシ保護程度が異なるような非対称型の差分プライバシの概念を定式化しそれを実現するための具体的なプライバシ保護機構を与えた.
|
Strategy for Future Research Activity |
複数のクライアントがパラメータサーバの協調により予測モデルを学習する連合学習(FL)において,クライアントの貢献度を評価するための原理的な尺度であるシャプレー値(SV)を計算する問題に取り組む.FLにおけるSVの評価には、生のモデルへのアクセスが必要でありクライアントの個人情報が信頼できないサーバに漏洩する可能性がある.クロスサイロFLにおけるSVの安全な評価の問題を検討し,同形暗号(Hemomorphic Encryption: HE)を用いたベースライン解決策と効率的な評価プロトコルを研究する. また,データ解析サーバが信頼できない場合に各クライアント自身がデータに確率的な雑音を加える局所差分プライバシがあるがデータ解析結果の性能が低下することが知られている.それを解決するためのシャッフリングモデルを改良し一般化する新たなモデルを開発し,個人化されたプライバシー保証のみでなく,そのプライバシ,有用性の既存のシャッフリングモデルとの関連性を数学的に示すことを目標とする.更に,実世界のデータを用いた実験を行い,連合学習と呼ばれる近年注目されている機械学習の枠組において,提案のモデルのプライバシ・有用性の観点での優位性を検証する.
|
Causes of Carryover |
COVID-19の終息が見込めず海外を含む出張を行えなかったため旅費を使用しなかった.また,博士後期課程学生が学術振興会特別研究員に採用されたため,RA雇用分の人件費を使用しなかった.本年度は,国際会議発表のための海外出張旅費を多く使用する予定である.
|
Research Products
(2 results)