2023 Fiscal Year Annual Research Report
R&D of Machine Learning Mechanism for Privacy Preserving Data Mining over Different Industries
Project/Area Number |
20K11826
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
王 立華 国立研究開発法人情報通信研究機構, サイバーセキュリティ研究所, 主任研究員 (00447228)
|
Co-Investigator(Kenkyū-buntansha) |
小澤 誠一 神戸大学, 数理・データサイエンスセンター, 教授 (70214129)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | プライバシー保護 / 連合学習 / 決定木 / 継続学習 / 差分プライバシー / 匿名化 |
Outline of Annual Research Achievements |
1.AIにおけるプライバシー保護を強化した連合学習:連合学習は、複数の組織がデータを共有せずに協力し、全体のデータに対して機械学習を行うための重要な手法である。情報が漏洩する可能性がある課題を特定し、それに対処するためのプライバシー保護を強化したフレームワークを提案。これは、深層学習や勾配ブ―スティング決定木(GBDT)など、既存の多くの連合学習システムでプライバシーを守るために適用される。成果は招待論文としてIEICE論文誌で掲載し、国内・国際学会で招待講演4件発表した。 2.継続学習化:GBDTに基づく効率的な連合学習方式に基づく継続学習化に関して、忘却防止に向け連合学習でも適用可能な勾配に基づくリプレイデータ選択方法の研究を取り組んでいる。成果はISEC研究会で発表し、国際会議ICONIP2024への投稿を準備中。 3.欠損補完:水平型連合学習で参加組織が所有する特徴量が一致しない場合、共通特徴量のみでモデル学習する必要があり、情報損失が問題となる。これを解決するため、敵対的生成ネットワークを用いた連合学習手法を提案。特定組織がもつ完全な特徴量に基づいて欠損補完する生成モデルを連合学習し、組織間で共有することで情報損失が軽減されことが期待される。成果はSCI'24で発表し、国際会議ICONIP2024への投稿を準備中。 4.決定木における差分プライバシー:決定木モデルから学習で利用したデータの漏洩を防ぐため、データセットのk-匿名と差分プライバシーの関係性を活用し、決定木学習において枝刈りの匿名化への効果に着目し、属するデータ数が少なく識別リスクが高くなる葉を剪定することで、ノイズ無しで差分プライバシーを満たす決定木の構築方法を提案。成果は国際会議ICONIP2023、国内学会SCIS2024で発表した。 上記の汎用的な提案手法は同業種か異業種かに関わらず適用可能である。
|