2023 Fiscal Year Research-status Report
個人の選好と報酬配分を考慮したパーソナルデータの健全で頑健な流通系構築に向けて
Project/Area Number |
21K19767
|
Research Institution | Osaka Seikei University |
Principal Investigator |
吉川 正俊 大阪成蹊大学, データサイエンス学部, 教授 (30182736)
|
Co-Investigator(Kenkyū-buntansha) |
曹 洋 北海道大学, 情報科学研究院, 准教授 (60836344)
鄭 舒元 大阪大学, 大学院情報科学研究科, 特任助教(常勤) (30994694)
|
Project Period (FY) |
2021-07-09 – 2025-03-31
|
Keywords | プライバシ保護 / 機械学習 / 連合学習 / シャープレー値 |
Outline of Annual Research Achievements |
クロスサイロ連合学習は,異なる組織が持つプライベートデータを共有せずに共同で機械学習モデルを訓練する手法である.各組織は自身のデータを保持したままモデルパラメータの更新情報のみを交換する.これにより,プライバシーを保護しつつ,各組織の多様なデータを訓練データとする機械学習モデルを得ることができ,特に,データセキュリティやプライバシが重視される銀行や医療機関などで有効な機械学習の訓練方法である. クロスサイロ連合学習においては,各組織が持つデータが学習モデル構築に貢献した度合いを評価することが重要になる.シャープレー値(Shapley Value)はそのための公平で原理的な指標である.しかし,連合学習における既存のシャープレー値計算手法は,サーバが生の連合学習モデルと公開テストデータにアクセスできることを前提としている.これは,連合学習モデルに対する新たなプライバシ攻撃や、テストデータが組織の資産である可能性を考慮すると,実際には有効な仮定ではない. そこで,クロスサイロ連合学習における安全なシャープレー値計算手法を開発した.まず,プライバシー保護のための準同型暗号(HE)のみに基づく1サーバによる計算手法としてHESVを開発した.しかし,HESVには性能限界があるため,次に,効率的な2サーバプロトコルであるSecSVを開発した.SecSVの特徴としては,第一に,ハイブリッドプライバシー保護方式を利用し,準同型暗号で非常に時間がかかるテストデータとモデル間の暗号文-暗号文の乗算を回避する.第二に,SecSVのために効率的かつ安全な行列乗算法を提案した.第三に、SecSVは、評価精度に大きな影響を与えずに,いくつかのテストサンプルを戦略的に識別しスキップする.SecSVはHESVと比較し7.2~36.6倍高速であり,計算されたシャープレー値の精度の損失は限定的であることを実証した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
クロスサイロ連合学習は,複数の組織が保有するデータをプライバシー保護をしたまま共同で連合学習するための有効な手法である.パーソナルデータの流通のためには,データの価値査定が重要になるが,今年度の研究ではそのためのシャープレー値計算の効率的な手法を開発し,トップクラスの国際学術論文誌であるProceedings of the VLDB Endowmentに成果論文が掲載された.
|
Strategy for Future Research Activity |
本補助事業の目的を精緻に達成するために,データの価値査定に関してシャープレー値の変種も含めた,より頑健な手法に関する研究を行う予定である.
|
Causes of Carryover |
本補助事業の目的を精緻に達成するために,データの価値査定に関してシャープレー値の変種も含めた,より頑健な手法に関する研究を行うために次年度使用額が生じた.学会参加による情報収集,研究発表,論文投稿費用,クラウド利用料などに使用する予定である.
|