2017 年度実績報告書

機械学習における統計的安全性の理論

研究課題

研究課題/領域番号	16H02864
研究機関	筑波大学
研究代表者	佐久間淳筑波大学, システム情報系, 教授 (90376963)
研究分担者	日野英逸筑波大学, システム情報系, 准教授 (10580079) 神嶌敏弘国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50356820) 兼村厚範国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (50580297) 松田隆宏国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60709492) 村上隆夫国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (80587981)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	機械学習 / プライバシー / セキュリティ / 差分プライバシー / 公正性配慮型データマイニング
研究実績の概要	今年度は以下の４つの主要な実績があった。（１）個人情報からなるベクトルを入力値として、線形モデルの評価値を公開した時に、第三者が評価値を得た場合，予測値から入力個人情報である入力値を推定される可能性がある．複数の線形回帰モデルから得た予測値から入力が推定されるリスクを定式化する方法を検討した。（２）公平性を達成するような分類器を獲得する公平性配慮型分類問題について研究を行った．既存の方法では，確定的な決定則とモデルバイアスの影響を無視していたが，これらを考慮した分布について公平性を保つ実独立性の概念を提示した．この実独立性を達成することで，より高度な水準での公平性が達成できることを実験的にも確認した．（３）外れ値検知あるいは新規性検出手法について研究をした．特定の分布を仮定することなく仮説検定により客観的に外れ値を検知する方法を検討した．具体的には，k近傍距離に基づく任意の外れ値度関数を基に，検査点が外れ値か否かを仮説検定によって判別する．仮説検定を行うには検定統計量の分布が必要だが，これをブートストラップ法を用いて与えられたデータに基づいて推定する方法を考案した．（４）ユーザが自身のパーソナルデータに差分プライバシーを満たすようにノイズを加えてデータ解析者に送り，データ解析者が元のパーソナルデータが従う分布を推定する問題に関する研究を行った．具体的には，分布推定法として反復ベイズ法に着眼し，サンプル数が少数の場合における推定誤差を，Rilstoneらの理論に基づいて補正する手法について検討した。そのほか、カイ二乗検定の差分プライバシー、経験的リスク最小化の局所差分プライバシー、深層学習によるmalware解析、f-divergence推定に関する理論解析、などの成果をえた。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由（１）線形回帰モデルにおいて予測値から入力が推定されるリスクを定式化し、このリスクを抑えつつ有用性を保つような出力を与えるメカニズムの開発においては、研究は順調に進展しており、すでに国際会議にて発表した。複数のモデルから得た予測値について同時に公開した場合におけるリスクを抑制するメカニズムについての研究をすすめ、論文公開を目指す。（２）公平性を達成するような分類器を獲得する公平性配慮型分類問題についても進捗は順調で、H30年度において、研究成果の国際会議発表を目指す。（３）ユーザが自身のパーソナルデータに差分プライバシーを満たすようにノイズを加えてデータ解析者に送り，データ解析者が元のパーソナルデータが従う分布を推定する問題に関する研究については、H30年度に国際会議での発表を予定している。
今後の研究の推進方策	（１）線形回帰モデルにおいて予測値から入力が推定されるリスクを定式化し、このリスクを抑えつつ有用性を保つような出力を与えるメカニズムの開発において、多数のモデルの予測値について同時に公開した場合については、リスク評価に計算爆発が起こる可能性がある。この点について、実データを用いた研究をすすめる。（２）センシティブ特徴に関して公平性を保証した分類問題については、理論面について研究をすすめる. 特に、モデルベースの独立性を実現する技術を用いて、不均衡データなどのバイアスを削除に応用できるかを検討する。（３）データ間の距離尺度の概念を導入した位置情報向け局所差分プライバシーを満たしつつ、分布を推定する問題を考え、サンプル数が少数の場合における推定誤差を、Rilstoneらの理論に基づいて補正する場合の理論解析を検討する。（４）新規の研究として、各個人からcontinualに生成されるセンシティブな離散データを、局所差分プライバシを保証しつつ公開し、それらから頻度など基礎的な統計量を推定する手法を開発するとともに、その有用性を理論解析する。（５）ring－LWEは完全準同型暗号の実現のベースとなる困難性をもつ問題である。新規の研究として、ring-LWEの困難性を、統計的に再解釈し、新しいタイプのプライバシー保護手法を実現する手法について検討する。

研究成果
(11件)

すべて 2018 2017

すべて雑誌論文 (10件) (うち査読あり 10件、オープンアクセス 3件) 学会発表 (1件)

[雑誌論文] Recommendation Independence2018
- 著者名/発表者名
  Toshihiro Kamishima, Shotaro Akaho, Hideki Asoh, Jun Sakuma
- 雑誌名
  
  Proceedings of Machine Learning Research
  
  巻: 81 ページ: 187-201
- 査読あり / オープンアクセス
[雑誌論文] Malware Analysis of Imaged Binary Samples by Convolutional Neural Network with Attention2018
- 著者名/発表者名
  Hiromu Yakura, Shinnosuke Shinozaki, Reon Nishimura, Yoshihiro Oyama, Jun Sakuma
- 雑誌名
  
  Proceedings of The 8th ACM Conference on Data and Application Security and Privacy
  
  巻: －ページ: 127-134
- DOI
  10.1145/3176258.3176335
- 査読あり
[雑誌論文] Model-based and actual independence for fairness-aware classification2017
- 著者名/発表者名
  Toshihiro Kamishima, Shotaro Akaho, Hideki Asoh, and Jun Sakuma
- 雑誌名
  
  Data Mining and Knowledge Discovery
  
  巻: 32 ページ: 258-286
- DOI
  10.1007/s10618-017-0534-x
- 査読あり
[雑誌論文] Mis-operation Resistant Searchable Homomorphic Encryption2017
- 著者名/発表者名
  Keita Emura,Takkuya Hayashi, Noboru Kunihiro, Jun Sakuma
- 雑誌名
  
  Proceedings of the 2017 ACM Asia Conference on Computer and Communications Security
  
  巻: －ページ: 215-229
- DOI
  10.1145/3052973.3053015
- 査読あり
[雑誌論文] Differentially Private Semi-Supervised Classification.2017
- 著者名/発表者名
  Xu Long, Jun Sakuma
- 雑誌名
  
  Proceedings of the 3rd IEEE International Conference on Smart Computing
  
  巻: －ページ: 1-6
- DOI
  10.1109/SMARTCOMP.2017.7947001
- 査読あり / オープンアクセス
[雑誌論文] Towards Privacy-preserving Record Linkage with Record-wise Linkage Policy2017
- 著者名/発表者名
  Takahito Kaiho , Wen-jie Lu, Toshiyuki Amagasa, and Jun Sakuma
- 雑誌名
  
  Database and Expert Systems Applications.
  
  巻: 10438 ページ: 233-248
- DOI
  10.1007/978-3-319-64468-4_18
- 査読あり
[雑誌論文] Differentially Private Chi-squared Test by Unit Circle Mechanism2017
- 著者名/発表者名
  Kazuya Kakizaki, Kazuto Fukuchi, and Jun Sakuma
- 雑誌名
  
  Proceedings of the 34th International Conference on Machine Learning
  
  巻: 70 ページ: 1761-1770
- 査読あり / オープンアクセス
[雑誌論文] Minimax Optimal Estimators for Additive Scalar Functionals of Discrete Distributions2017
- 著者名/発表者名
  Kazuto Fukuchi and Jun Sakuma
- 雑誌名
  
  Proceedings of the 2017 IEEE International Symposium on Information Theory
  
  巻: －ページ: 2103-2107
- DOI
  10.1109/ISIT.2017.8006900
- 査読あり
[雑誌論文] Differentially Private Empirical Risk Minimization with Input Perturbation2017
- 著者名/発表者名
  Kazuto Fukuchi, Quang Khai Tran, and Jun Sakuma
- 雑誌名
  
  Proceedings of International Conference on Discovery Science
  
  巻: 10558 ページ: 82-90
- DOI
  10.1007/978-3-319-67786-6_6
- 査読あり
[雑誌論文] Reconstructable and interpretable representations for time series with time-skip sparse dictionary learning2017
- 著者名/発表者名
  Genta Yoshimura, Atsunori Kanemura, Hideki Asoh
- 雑誌名
  
  Proceedings of the Thematic Workshops of ACM Multimedia
  
  巻: - ページ: 323-331
- 査読あり
[学会発表] ブートストラップ分布に基づく外れ値検定2018
- 著者名/発表者名
  日野英逸
- 学会等名
  情報論的学習理論研究会

2017 年度 実績報告書

機械学習における統計的安全性の理論

研究代表者

佐久間 淳 筑波大学, システム情報系, 教授 (90376963)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Recommendation Independence2018

著者名/発表者名

雑誌名

[雑誌論文] Malware Analysis of Imaged Binary Samples by Convolutional Neural Network with Attention2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Model-based and actual independence for fairness-aware classification2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Mis-operation Resistant Searchable Homomorphic Encryption2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Differentially Private Semi-Supervised Classification.2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Towards Privacy-preserving Record Linkage with Record-wise Linkage Policy2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Differentially Private Chi-squared Test by Unit Circle Mechanism2017

著者名/発表者名

雑誌名

[雑誌論文] Minimax Optimal Estimators for Additive Scalar Functionals of Discrete Distributions2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Differentially Private Empirical Risk Minimization with Input Perturbation2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Reconstructable and interpretable representations for time series with time-skip sparse dictionary learning2017

著者名/発表者名

雑誌名

[学会発表] ブートストラップ分布に基づく外れ値検定2018

著者名/発表者名

学会等名

2017 年度実績報告書

佐久間淳筑波大学, システム情報系, 教授 (90376963)