2014 Fiscal Year Annual Research Report
プライバシー保護データマイニングにおける分散型回帰分析の実用化
Project/Area Number |
25870812
|
Research Institution | Waseda University |
Principal Investigator |
須子 統太 早稲田大学, 社会科学総合学術院, 講師 (40409660)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | データマイニング / プライバシー保護 / 分散計算 / 回帰分析 / アルゴリズム |
Outline of Annual Research Achievements |
本研究課題ではプライバシーを保護した回帰分析の分散計算について扱った.これは,複数のユーザ(サーバ)が異なるデータセそ ットを保持しているもとで,それぞれのデータセットの中身についてはお互い秘匿したまま,全てのデータセットを用いた場合と同様 の回帰分析結果を得るというものである.例えばA社とB社がそれぞれ保持する顧客データを合わせることで,より精密な回帰分析をし たいと考えた場合,いくら協力関係にあると言っても,そのまま自社の顧客データを他社に見せてしまうことはできない.そこで,この技術を用いることで,それぞれの会社の,顧客のプラバシーを保護したまま,より精度の高い回帰分析を行おうというものである.この分野では,従来よりいくつかの先行研究が行われているが,本研究課題ではそれらに対し,分析手法の一般化と分割方法の一般化の2種類の一般化を行うことで実用的に有用なプロトコルの開発を目指した. 2013年度では特に分析手法の一般化を行う計画であった.特に従来,最小二乗推定量に関する研究が主であったことから,最小二乗推定量以外の推定量に対してのプロトコルの開発や性能の 評価や,変数選択を含む場合のプロトコルの開発を目的としていた.しかし,研究を進める過程で,基となる最小二乗推定量を求めるプロトコルが,条件によって収束性能が悪くなり計算量が多くなってしまう事がわかった.そこでまず,最小二乗推定量に対して,プロトコルの収束性能を改善する改良プロトコルの開発を行い.収束性能の評価を改めて行った.その結果,収束性能を大幅に改善することができ計算量の削減に成功した.この結果については,日本経営工学会論文誌に論文を投稿し載録された. 2014年度には,2013年度に開発したプロトコルをさらに発展させ,通常の最小二乗推定量ではなく,L1正則化最小二乗推定量を求めるプロトコルを提案した.
|
Research Products
(5 results)