研究課題/領域番号 |
21H03442
|
研究機関 | 大阪大学 |
研究代表者 |
小泉 佑揮 大阪大学, 情報科学研究科, 准教授 (50552072)
|
研究分担者 |
栗原 淳 兵庫県立大学, 情報科学研究科, 准教授 (10577399)
大木 哲史 静岡大学, 情報学部, 准教授 (80537407)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 機械学習 / コンピューティング / プライバシー / セキュリティ / SGX |
研究実績の概要 |
本年度は、当初予定通り、機械学習モデルから漏洩するプライバシーの保護を目的としたセキュアなモデルの集約法の設計と、入力データへの改竄と処理中のデータ改竄を防ぐ計算ノードを設計した。さらに、当初予定に加えて、分散計算アーキテクチャの基盤となり機械学習のモデル集約の通信を支える匿名通信プロトコルの設計に取り組んだ。 フェデレーテッドラーニングは、ユーザー端末上でユーザ自身の学習データを用いてモデルを更新し、それをサーバーで集約する学習法である。ユーザーは、学習データを自身の端末から出さないために、学習データのプライバシー保護が可能であると期待されている。しかし、モデルインバージョン攻撃により、モデルから学習データが復元できることが指摘されている。これに対して、モデルに対して乱数でマスクをしつつも、全ユーザーでマスクしたモデルを足し合わせることでマスクが秘密裏に消えるセキュアな集約法を設計した。これにより、モデル集約の負荷を向上することなく、モデルインバージョン攻撃を防止した。加えて、分散計算アーキテクチャにおいてリソースを保護した安全な計算を実現するために、その計算リソースの利用認可フレームワークを検討した。 入力データへの改竄と処理中のデータ改竄を防ぐ計算ノードについては、Intel SGXに代表されるセキュアな計算環境上に、セキュアなモデル集約の計算を実装するための安全な計算法を設計した。具体的には、SGXを実装したCPUまでIP secで通信することで、プラットフォームに対してモデルの盗聴を防御することを可能にした。さらに、ブラックボックス型ネットワークへの攻撃への検討を進めた。 さらに、匿名通信プロトコルについては、ネットワーク層において、攻撃者が盗聴したパケットから送信者と受信者の識別子を紐付けることを防ぐプロトコルを設計した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
機械学習から漏洩するプライバシーの保護する分散型計算アーキテクチャと入力データへの改竄と処理中のデータ改竄を防ぐ計算ノードについて、当初予定通りに研究が進んでいる。加えて、基盤となるネットワーク上の匿名通信プロトコルの設計も完了した。これを鑑みると、当初の予定以上に進んでいると言える。
|
今後の研究の推進方策 |
今後は、機械学習のモデルからの情報漏洩を防ぐ分散型計算アーキテクチャと、入力データへの改竄と処理中のデータ改竄を防ぐ計算ノードの高度化を進める。 分散型計算アーキテクチャについては、今年度に設計したフェデレーテッドラーニングを対象としたモデルの安全な集約法をベースに、安全性の向上を目的とした鍵交換プロトコルの設計、トラヒック削減を目的とした集約法の高度化、および、実用可能性向上を目的とした運用プロトコルを設計する。鍵交換にはディフィー・ヘルマン鍵共有を用いる。集約法については、モデルそのものを交換するのではなく、データ生成のシードを共有する手法を検討する。運用プロトコルについては、モデル集約中にロストする端末の存在を想定し、交換する情報に対して一定の冗長性を持たせる方法を検討する。 続いて、計算ノードの設計については、隔離された実行環境とメモリ環境であるIntel SGX上で、攻撃者から参照できない環境および悪意のあるプログラムを注入できない機械学習計算環境を設計する。今年度の設計をベースに、パフォーマンスの向上を検討する。具体的には、一部のパフォーマンスを有する計算はIntel SGX外で実行する必要があるため、それらのプログラムを安全連結するためのプログラムを、メモリの所有権管理機能を有するRustを用いて実装する。
|