個人の選好と報酬配分を考慮したパーソナルデータの健全で頑健な流通系構築に向けて

Research Project

Project/Area Number	21K19767
Research Category	Grant-in-Aid for Challenging Research (Exploratory)
Allocation Type	Multi-year Fund
Review Section	Medium-sized Section 60:Information science, computer engineering, and related fields
Research Institution	Osaka Seikei University (2023) Kyoto University (2021-2022)
Principal Investigator	吉川正俊大阪成蹊大学, データサイエンス学部, 教授 (30182736)
Co-Investigator(Kenkyū-buntansha)	曹洋北海道大学, 情報科学研究院, 准教授 (60836344) 鄭舒元大阪大学, 大学院情報科学研究科, 特任助教(常勤) (30994694)
Project Period (FY)	2021-07-09 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000) Fiscal Year 2023: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000) Fiscal Year 2022: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000) Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Keywords	プライバシ保護 / 機械学習 / 連合学習 / シャープレー値 / パーソナルデータ市場 / パーソナルデータ / プライバシー保護 / 差分プライバシー / データ価値査定
Outline of Research at the Start	国家によるGAFAなどのプラットフォーム大手に対する規制とは別に，各個人がパーソナルデータを管理，制御する手法を開発することにより，パーソナルデータを個人及び社会の資産として活用するための健全なデータ流通系を構築することを目的とする．流通系にパーソナルデータを取得しようとするする悪意を持った者が存在することを仮定する安全なデータ流通系の構築を目指す．各個人がパーソナルデータの種類ごとにプライバシー保護を望む程度に応じて，個人が提供したパーソナルデータに対する対価を得るための技術開発を行う．
Outline of Annual Research Achievements	クロスサイロ連合学習は，異なる組織が持つプライベートデータを共有せずに共同で機械学習モデルを訓練する手法である．各組織は自身のデータを保持したままモデルパラメータの更新情報のみを交換する．これにより，プライバシーを保護しつつ，各組織の多様なデータを訓練データとする機械学習モデルを得ることができ，特に，データセキュリティやプライバシが重視される銀行や医療機関などで有効な機械学習の訓練方法である．クロスサイロ連合学習においては，各組織が持つデータが学習モデル構築に貢献した度合いを評価することが重要になる．シャープレー値(Shapley Value)はそのための公平で原理的な指標である．しかし，連合学習における既存のシャープレー値計算手法は，サーバが生の連合学習モデルと公開テストデータにアクセスできることを前提としている．これは，連合学習モデルに対する新たなプライバシ攻撃や、テストデータが組織の資産である可能性を考慮すると，実際には有効な仮定ではない．そこで，クロスサイロ連合学習における安全なシャープレー値計算手法を開発した．まず，プライバシー保護のための準同型暗号（HE）のみに基づく1サーバによる計算手法としてHESVを開発した．しかし，HESVには性能限界があるため，次に，効率的な2サーバプロトコルであるSecSVを開発した．SecSVの特徴としては，第一に，ハイブリッドプライバシー保護方式を利用し，準同型暗号で非常に時間がかかるテストデータとモデル間の暗号文-暗号文の乗算を回避する．第二に，SecSVのために効率的かつ安全な行列乗算法を提案した．第三に、SecSVは、評価精度に大きな影響を与えずに，いくつかのテストサンプルを戦略的に識別しスキップする．SecSVはHESVと比較し7.2～36.6倍高速であり，計算されたシャープレー値の精度の損失は限定的であることを実証した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason クロスサイロ連合学習は，複数の組織が保有するデータをプライバシー保護をしたまま共同で連合学習するための有効な手法である．パーソナルデータの流通のためには，データの価値査定が重要になるが，今年度の研究ではそのためのシャープレー値計算の効率的な手法を開発し，トップクラスの国際学術論文誌であるProceedings of the VLDB Endowmentに成果論文が掲載された．
Strategy for Future Research Activity	本補助事業の目的を精緻に達成するために，データの価値査定に関してシャープレー値の変種も含めた，より頑健な手法に関する研究を行う予定である．

Report

(3 results)

Research Products
(6 results)

All 2023 2022 2021 Other

All Int'l Joint Research (2 results) Journal Article (2 results) (of which Peer Reviewed: 2 results, Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 2 results)

[Int'l Joint Research] WeBank Co., Ltd.(中国)
- Related Report
  2022 Research-status Report
[Int'l Joint Research] Singapore Management University(シンガポール)
- Related Report
  2022 Research-status Report
[Journal Article] Secure Shapley Value for Cross-Silo Federated Learning2023
- Author(s)
  Shuyuan Zheng, Yang Cao, and Masatoshi Yoshikawa
- Journal Title
  
  Proceedings of the VLDB Endowment
  
  Volume: 16 Issue: 7 Pages: 1657-1670
- DOI
  10.14778/3587136.3587141
- Related Report
  2023 Research-status Report 2022 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] PCT-TEE: Trajectory-based Private Contact Tracing System with Trusted Execution Environment2022
- Author(s)
  Kato Fumiyuki、Cao Yang、Yoshikawa Masatoshi
- Journal Title
  
  ACM Transactions on Spatial Algorithms and Systems
  
  Volume: 8 Issue: 2 Pages: 1-35
- DOI
  10.1145/3490491
- Related Report
  2021 Research-status Report
- Peer Reviewed
[Presentation] FL-Market: Trading Private Models in Federated Learning2022
- Author(s)
  Shuyuan Zheng, Yang Cao, Masatoshi Yoshikawa, Huizhong Li, Qiang Yan
- Organizer
  IEEE International Conference on Big Data, Big Data 2022
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] Preventing Manipulation Attack in Local Differential Privacy using Verifiable Randomization Mechanism2021
- Author(s)
  Fumiyuki Kato, Yang Cao and Masatoshi Yoshikawa
- Organizer
  The 35th Annual IFIP WG 11.3 Conference on Data and Applications Security and Privacy (DBSec 2021)
- Related Report
  2021 Research-status Report
- Int'l Joint Research

個人の選好と報酬配分を考慮したパーソナルデータの健全で頑健な流通系構築に向けて

Principal Investigator

吉川 正俊 大阪成蹊大学, データサイエンス学部, 教授 (30182736)

¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)

Current Status of Research Progress

Reason

Report

Research Products

[Int'l Joint Research] WeBank Co., Ltd.(中国)

Related Report

[Int'l Joint Research] Singapore Management University(シンガポール)

Related Report

[Journal Article] Secure Shapley Value for Cross-Silo Federated Learning2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] PCT-TEE: Trajectory-based Private Contact Tracing System with Trusted Execution Environment2022

Author(s)

Journal Title

DOI

Related Report

[Presentation] FL-Market: Trading Private Models in Federated Learning2022

Author(s)

Organizer

Related Report

[Presentation] Preventing Manipulation Attack in Local Differential Privacy using Verifiable Randomization Mechanism2021

Author(s)

Organizer

Related Report

吉川正俊大阪成蹊大学, データサイエンス学部, 教授 (30182736)