2019 Fiscal Year Annual Research Report
A Study on Reduction of Information Loss and Improvement of Performance of Anonymization Processing for Streaming Data
Project/Area Number |
17K00188
|
Research Institution | Hiroshima City University |
Principal Investigator |
若林 真一 広島市立大学, 情報科学研究科, 教授 (50210860)
|
Co-Investigator(Kenkyū-buntansha) |
上土井 陽子 広島市立大学, 情報科学研究科, 講師 (80264935)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | ストリームデータ / k-匿名化 / FDH / l-多様性 |
Outline of Annual Research Achievements |
近年のSNSやオンラインショッピングの普及に伴い、連続的に流れ続けるビッグデータに対する高速データ解析が求められるようになってきた。このようなデータはストリームデータと呼ばれる。本研究は、個人情報保護と高速データ解析の両立を目的として、ストリームデータに対するFDH(Flexible Distance-based Hashing)に基づくk-匿名化手法を提案する。 FDHは高次元データ空間をアンカー集合と呼ばれるk個のデータ点からの距離によって2^k個の部分空間に分割し、それぞれの部分空間にビットマップと呼ばれる2進数を割り当て、ビットマップをハッシュ値とすることで与えられたクエリに対する近傍部分空間に含まれるデータ点集合を高速に探索する近似最近傍探索手法である。昨年度までの研究においてFDHに対する様々な改良を提案し、計算機実験により有効性を示した。さらに、FDHに基づく近似最近傍探索の専用ハードウェアを提案した。 本年度はFDHを拡張したFDHQ(Flexible Distance-based Hashing with Quadrisection)を提案した。FDHが探索領域を定義する各アンカーに対してデータ空間を2分割するのに対し、FDHQはデータ空間を4分割することで探索対象データの絞り込みと部分空間ごとのデータ数の均等化を実現した。また、FDHQのアンカー集合を複数にすることで計算時間と正答率のトレードオフの柔軟な制御を可能にする手法を提案し、計算機実験により有効性を示した。 さらに、FDHQに基づくストリームデータに対するk-匿名化手法を提案した。提案手法においては、l-多様性を考慮したk-匿名化も実現できるようにした。提案手法をプログラムとして実装し、計算機実験により提案手法の有効性を示した。
|
Research Products
(1 results)