研究課題/領域番号 |
21H03442
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60070:情報セキュリティ関連
|
研究機関 | 大阪大学 |
研究代表者 |
小泉 佑揮 大阪大学, 大学院情報科学研究科, 准教授 (50552072)
|
研究分担者 |
栗原 淳 兵庫県立大学, 情報科学研究科, 准教授 (10577399)
大木 哲史 静岡大学, 情報学部, 准教授 (80537407)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
16,900千円 (直接経費: 13,000千円、間接経費: 3,900千円)
2023年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2022年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2021年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
|
キーワード | コンピューティング / 機械学習 / プライバシー / セキュリティー / SGX / セキュリティ / 計算プラットフォーム / バックドア攻撃 |
研究開始時の研究の概要 |
本研究は、機械学習に関わるセキュリティーおよびプライバシー上の脅威に対してアドホックに解決するのではなく、種々の脅威を、脅威1) モデルからの情報漏洩、脅威2) 入力データの改竄などの攻撃、脅威3) モデルの改竄の3種類の攻撃の3つに分類して考え、これらの脅威に対して、AI向け分散計算、ノードの安全性検証、モデルの真正性検証などコンピューティングの観点から総合的にアプローチし、AIシステムのための安全な計算プラットフォームを実現することである。
|
研究実績の概要 |
本年度は、予定通り、機械学習モデルから漏洩するプライバシーの保護を目的としたセキュアなモデルの集約法の高度化と、分散学習における悪意のある通信を遮断するプロトコルの設計に取り組んだ。 機械学習の方法として、これまでと同様にフェデレーテッドラーニングに注目した。フェデレーテッドラーニングは、学習データがユーザーの端末から出ないため、プライバシー保護の観点で有利であるとされているが、モデルインバージョンなどによりモデルから漏洩するプライバシー情報の保護には課題が残る。これに対して、本課題では、モデルに対して乱数でマスクをしつつも、全ユーザーでマスクしたモデルを足し合わせることでマスクが秘密裏に消えるセキュアなモデル集約法で対応した。ただし、この方法は、各ユーザーが更新したマスク付きモデルを他のユーザーと交換するため、通信量が多いという課題が残っていた。これに対して、安全に集約する性質を満たしながら一部をサーバーによる集約に置き換えることで、安全性を担保しながら通信量を削減する手法を設計した。さらに、サーバーによる検証にはGPUの利用を可能にし、これにより、フェデレーテッドラーニングにおけるセキュアな集約のスケーラビリティーを向上させた。さらに、改変したモデルなど、悪意のあるモデルを検出する既存のプロトコルに対しても、この方法を適用することを可能にした。 一方、分散学習を支える通信プロトコルについては、これまでに検討していた軽量な匿名通信プロトコルに加え、匿名性と責任追跡性を両立する手法を設計した。具体的には、ユーザーの匿名性を担保しながらも、過去に悪意のある通信をしたユーザーからの通信を遮断することを可能にするプロトコルを設計した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
機械学習から漏洩するプライバシーを保護する分散型アーキテクチャについては、提案書に記載した通りに進んでいる。これに加えて、分散型の計算プラットフォームの基盤となる匿名通信プロトコルとその安全性についての研究も進んでいる。これは、当初提案から発展した内容であり、これらの進捗を鑑みると、当初の予定以上に進んでいると言える。
|
今後の研究の推進方策 |
最終年度は、これまでに検討した機械学習のモデルからの情報漏洩を防ぐ分散型AI計算プラットフォームの高度化に向けて研究を進める。 これまでに開発したモデルからの情報漏洩を防ぐ手法を、創薬プラットフォームなどより高度な安全性が要求される分散学習プラットフォームへ適用することを検討する。具体的には、各ユーザーが更新したモデルを、中央集権的なサーバーではなく、個々のユーザーが集約する分散集約型のフェデレーテッドラーニングに対して、これまでに設計した手法を適用する。このときの課題は、分散集約をすると、信頼できないユーザーの存在により、モデルの集約が担保されず、マスクしたモデルが復元されないまま集約されてしまうことである。これに対して、秘密分散と冗長符号化により、マスクに対して多少の冗長性を持たせながら、一部の悪意ある集約の結果を復元できる方法を設計する。
|