研究課題/領域番号 |
21K19767
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分60:情報科学、情報工学およびその関連分野
|
研究機関 | 京都大学 |
研究代表者 |
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
|
研究分担者 |
曹 洋 北海道大学, 情報科学研究院, 准教授 (60836344)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2023年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | パーソナルデータ市場 / プライバシ保護 / 機械学習 / 連合学習 / シャープレー値 / パーソナルデータ / プライバシー保護 / 差分プライバシー / データ価値査定 |
研究開始時の研究の概要 |
国家によるGAFAなどのプラットフォーム大手に対する規制とは別に,各個人がパーソナルデータを管理,制御する手法を開発することにより,パーソナルデータを個人及び社会の資産として活用するための健全なデータ流通系を構築することを目的とする.流通系にパーソナルデータを取得しようとするする悪意を持った者が存在することを仮定する安全なデータ流通系の構築を目指す.各個人がパーソナルデータの種類ごとにプライバシー保護を望む程度に応じて,個人が提供したパーソナルデータに対する対価を得るための技術開発を行う.
|
研究実績の概要 |
個人のパーソナルデータを,信頼できない機械学習モデルブローカーからプライバシー保護する市場機構を提案した.多数の個人からパーソナルデータを収集し機械学習によるデータ分析を行う場合,既存研究では機械学習を行うブローカーがデータ所有者のプライベートな学習データにアクセスできることを前提としており,現実的でない場合がある.本研究では,機械学習タスクのための信頼できるデータ取得を促進するために,信頼できないブローカーからプライバシーを保護する局所的プライベートモデル市場機構を提案した.この市場機構では,データ所有者が局所的な差分プライバシにより局所的に勾配を変化させることを可能にし,プライバシー漏洩リスクを低減させることができる.この市場機構を推進するために,局所的勾配の摂動レベルを決定するための深層学習を活用したオークション機構と摂動された勾配を集約するための最適な集約機構を提案した.この研究成果は,国際会議IEEE BigData2022で発表した.
さらに,比較的大量のデータを保有する複数のサーバが協調して機械学習を行い予測モデルを構築するクロスサイロ連合学習において各サーバの貢献度を評価する指標としてシャプレー値を計算する場合に,各サーバのパーソナルデータを安全に保護するプロトコルを提案した.本研究では,クロスサイロ連合学習における安全なシャープレー値算出のための効率的な2サーバプロトコルであるSecSVを提案した.この研究成果は,国際学術雑誌PVLDBに掲載された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
大規模機械学習モデルを対象とするプライバシ保護のもとでのパーソナルデータ市場実現に関する新たな手法を提案し,トップレベルの国際会議や国際学術誌での発表を行なった.
|
今後の研究の推進方策 |
学習済みの機械学習モデルをもとにAPI呼び出しに対する課金を行うビジネスモデルにおいて,呼び出しを繰り返すことにより学習モデルそのものを奪おうとする悪意を持つ買い手から学習モデルを防御するための価格付け手法に関する研究を推進する予定である.
|