2017 Fiscal Year Annual Research Report

Statistical Security of Machine Learning

Research Project

Project/Area Number	16H02864
Research Institution	University of Tsukuba
Principal Investigator	佐久間淳筑波大学, システム情報系, 教授 (90376963)
Co-Investigator(Kenkyū-buntansha)	日野英逸筑波大学, システム情報系, 准教授 (10580079) 神嶌敏弘国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50356820) 兼村厚範国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (50580297) 松田隆宏国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60709492) 村上隆夫国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (80587981)
Project Period (FY)	2016-04-01 – 2019-03-31
Keywords	機械学習 / プライバシー / セキュリティ / 差分プライバシー / 公正性配慮型データマイニング
Outline of Annual Research Achievements	今年度は以下の４つの主要な実績があった。（１）個人情報からなるベクトルを入力値として、線形モデルの評価値を公開した時に、第三者が評価値を得た場合，予測値から入力個人情報である入力値を推定される可能性がある．複数の線形回帰モデルから得た予測値から入力が推定されるリスクを定式化する方法を検討した。（２）公平性を達成するような分類器を獲得する公平性配慮型分類問題について研究を行った．既存の方法では，確定的な決定則とモデルバイアスの影響を無視していたが，これらを考慮した分布について公平性を保つ実独立性の概念を提示した．この実独立性を達成することで，より高度な水準での公平性が達成できることを実験的にも確認した．（３）外れ値検知あるいは新規性検出手法について研究をした．特定の分布を仮定することなく仮説検定により客観的に外れ値を検知する方法を検討した．具体的には，k近傍距離に基づく任意の外れ値度関数を基に，検査点が外れ値か否かを仮説検定によって判別する．仮説検定を行うには検定統計量の分布が必要だが，これをブートストラップ法を用いて与えられたデータに基づいて推定する方法を考案した．（４）ユーザが自身のパーソナルデータに差分プライバシーを満たすようにノイズを加えてデータ解析者に送り，データ解析者が元のパーソナルデータが従う分布を推定する問題に関する研究を行った．具体的には，分布推定法として反復ベイズ法に着眼し，サンプル数が少数の場合における推定誤差を，Rilstoneらの理論に基づいて補正する手法について検討した。そのほか、カイ二乗検定の差分プライバシー、経験的リスク最小化の局所差分プライバシー、深層学習によるmalware解析、f-divergence推定に関する理論解析、などの成果をえた。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason （１）線形回帰モデルにおいて予測値から入力が推定されるリスクを定式化し、このリスクを抑えつつ有用性を保つような出力を与えるメカニズムの開発においては、研究は順調に進展しており、すでに国際会議にて発表した。複数のモデルから得た予測値について同時に公開した場合におけるリスクを抑制するメカニズムについての研究をすすめ、論文公開を目指す。（２）公平性を達成するような分類器を獲得する公平性配慮型分類問題についても進捗は順調で、H30年度において、研究成果の国際会議発表を目指す。（３）ユーザが自身のパーソナルデータに差分プライバシーを満たすようにノイズを加えてデータ解析者に送り，データ解析者が元のパーソナルデータが従う分布を推定する問題に関する研究については、H30年度に国際会議での発表を予定している。
Strategy for Future Research Activity	（１）線形回帰モデルにおいて予測値から入力が推定されるリスクを定式化し、このリスクを抑えつつ有用性を保つような出力を与えるメカニズムの開発において、多数のモデルの予測値について同時に公開した場合については、リスク評価に計算爆発が起こる可能性がある。この点について、実データを用いた研究をすすめる。（２）センシティブ特徴に関して公平性を保証した分類問題については、理論面について研究をすすめる. 特に、モデルベースの独立性を実現する技術を用いて、不均衡データなどのバイアスを削除に応用できるかを検討する。（３）データ間の距離尺度の概念を導入した位置情報向け局所差分プライバシーを満たしつつ、分布を推定する問題を考え、サンプル数が少数の場合における推定誤差を、Rilstoneらの理論に基づいて補正する場合の理論解析を検討する。（４）新規の研究として、各個人からcontinualに生成されるセンシティブな離散データを、局所差分プライバシを保証しつつ公開し、それらから頻度など基礎的な統計量を推定する手法を開発するとともに、その有用性を理論解析する。（５）ring－LWEは完全準同型暗号の実現のベースとなる困難性をもつ問題である。新規の研究として、ring-LWEの困難性を、統計的に再解釈し、新しいタイプのプライバシー保護手法を実現する手法について検討する。

Research Products
(11 results)

All 2018 2017

All Journal Article (10 results) (of which Peer Reviewed: 10 results, Open Access: 3 results) Presentation (1 results)

[Journal Article] Recommendation Independence2018
- Author(s)
  Toshihiro Kamishima, Shotaro Akaho, Hideki Asoh, Jun Sakuma
- Journal Title
  
  Proceedings of Machine Learning Research
  
  Volume: 81 Pages: 187-201
- Peer Reviewed / Open Access
[Journal Article] Malware Analysis of Imaged Binary Samples by Convolutional Neural Network with Attention2018
- Author(s)
  Hiromu Yakura, Shinnosuke Shinozaki, Reon Nishimura, Yoshihiro Oyama, Jun Sakuma
- Journal Title
  
  Proceedings of The 8th ACM Conference on Data and Application Security and Privacy
  
  Volume: － Pages: 127-134
- DOI
  10.1145/3176258.3176335
- Peer Reviewed
[Journal Article] Model-based and actual independence for fairness-aware classification2017
- Author(s)
  Toshihiro Kamishima, Shotaro Akaho, Hideki Asoh, and Jun Sakuma
- Journal Title
  
  Data Mining and Knowledge Discovery
  
  Volume: 32 Pages: 258-286
- DOI
  10.1007/s10618-017-0534-x
- Peer Reviewed
[Journal Article] Mis-operation Resistant Searchable Homomorphic Encryption2017
- Author(s)
  Keita Emura,Takkuya Hayashi, Noboru Kunihiro, Jun Sakuma
- Journal Title
  
  Proceedings of the 2017 ACM Asia Conference on Computer and Communications Security
  
  Volume: － Pages: 215-229
- DOI
  10.1145/3052973.3053015
- Peer Reviewed
[Journal Article] Differentially Private Semi-Supervised Classification.2017
- Author(s)
  Xu Long, Jun Sakuma
- Journal Title
  
  Proceedings of the 3rd IEEE International Conference on Smart Computing
  
  Volume: － Pages: 1-6
- DOI
  10.1109/SMARTCOMP.2017.7947001
- Peer Reviewed / Open Access
[Journal Article] Towards Privacy-preserving Record Linkage with Record-wise Linkage Policy2017
- Author(s)
  Takahito Kaiho , Wen-jie Lu, Toshiyuki Amagasa, and Jun Sakuma
- Journal Title
  
  Database and Expert Systems Applications.
  
  Volume: 10438 Pages: 233-248
- DOI
  10.1007/978-3-319-64468-4_18
- Peer Reviewed
[Journal Article] Differentially Private Chi-squared Test by Unit Circle Mechanism2017
- Author(s)
  Kazuya Kakizaki, Kazuto Fukuchi, and Jun Sakuma
- Journal Title
  
  Proceedings of the 34th International Conference on Machine Learning
  
  Volume: 70 Pages: 1761-1770
- Peer Reviewed / Open Access
[Journal Article] Minimax Optimal Estimators for Additive Scalar Functionals of Discrete Distributions2017
- Author(s)
  Kazuto Fukuchi and Jun Sakuma
- Journal Title
  
  Proceedings of the 2017 IEEE International Symposium on Information Theory
  
  Volume: － Pages: 2103-2107
- DOI
  10.1109/ISIT.2017.8006900
- Peer Reviewed
[Journal Article] Differentially Private Empirical Risk Minimization with Input Perturbation2017
- Author(s)
  Kazuto Fukuchi, Quang Khai Tran, and Jun Sakuma
- Journal Title
  
  Proceedings of International Conference on Discovery Science
  
  Volume: 10558 Pages: 82-90
- DOI
  10.1007/978-3-319-67786-6_6
- Peer Reviewed
[Journal Article] Reconstructable and interpretable representations for time series with time-skip sparse dictionary learning2017
- Author(s)
  Genta Yoshimura, Atsunori Kanemura, Hideki Asoh
- Journal Title
  
  Proceedings of the Thematic Workshops of ACM Multimedia
  
  Volume: - Pages: 323-331
- Peer Reviewed
[Presentation] ブートストラップ分布に基づく外れ値検定2018
- Author(s)
  日野英逸
- Organizer
  情報論的学習理論研究会

2017 Fiscal Year Annual Research Report

Statistical Security of Machine Learning

Principal Investigator

佐久間 淳 筑波大学, システム情報系, 教授 (90376963)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Recommendation Independence2018

Author(s)

Journal Title

[Journal Article] Malware Analysis of Imaged Binary Samples by Convolutional Neural Network with Attention2018

Author(s)

Journal Title

DOI

[Journal Article] Model-based and actual independence for fairness-aware classification2017

Author(s)

Journal Title

DOI

[Journal Article] Mis-operation Resistant Searchable Homomorphic Encryption2017

Author(s)

Journal Title

DOI

[Journal Article] Differentially Private Semi-Supervised Classification.2017

Author(s)

Journal Title

DOI

[Journal Article] Towards Privacy-preserving Record Linkage with Record-wise Linkage Policy2017

Author(s)

Journal Title

DOI

[Journal Article] Differentially Private Chi-squared Test by Unit Circle Mechanism2017

Author(s)

Journal Title

[Journal Article] Minimax Optimal Estimators for Additive Scalar Functionals of Discrete Distributions2017

Author(s)

Journal Title

DOI

[Journal Article] Differentially Private Empirical Risk Minimization with Input Perturbation2017

Author(s)

Journal Title

DOI

[Journal Article] Reconstructable and interpretable representations for time series with time-skip sparse dictionary learning2017

Author(s)

Journal Title

[Presentation] ブートストラップ分布に基づく外れ値検定2018

Author(s)

Organizer

佐久間淳筑波大学, システム情報系, 教授 (90376963)