• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

ストリームデータに対する匿名化処理の情報損失低減と高速化に関する研究

研究課題

研究課題/領域番号 17K00188
研究機関広島市立大学

研究代表者

若林 真一  広島市立大学, 情報科学研究科, 教授 (50210860)

研究分担者 上土井 陽子  広島市立大学, 情報科学研究科, 講師 (80264935)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワードストリームデータ / k-匿名化 / FDH / l-多様性
研究実績の概要

近年のSNSやオンラインショッピングの普及に伴い、連続的に流れ続けるビッグデータに対する高速データ解析が求められるようになってきた。このようなデータはストリームデータと呼ばれる。本研究は、個人情報保護と高速データ解析の両立を目的として、ストリームデータに対するFDH(Flexible Distance-based Hashing)に基づくk-匿名化手法を提案する。
FDHは高次元データ空間をアンカー集合と呼ばれるk個のデータ点からの距離によって2^k個の部分空間に分割し、それぞれの部分空間にビットマップと呼ばれる2進数を割り当て、ビットマップをハッシュ値とすることで与えられたクエリに対する近傍部分空間に含まれるデータ点集合を高速に探索する近似最近傍探索手法である。昨年度までの研究においてFDHに対する様々な改良を提案し、計算機実験により有効性を示した。さらに、FDHに基づく近似最近傍探索の専用ハードウェアを提案した。
本年度はFDHを拡張したFDHQ(Flexible Distance-based Hashing with Quadrisection)を提案した。FDHが探索領域を定義する各アンカーに対してデータ空間を2分割するのに対し、FDHQはデータ空間を4分割することで探索対象データの絞り込みと部分空間ごとのデータ数の均等化を実現した。また、FDHQのアンカー集合を複数にすることで計算時間と正答率のトレードオフの柔軟な制御を可能にする手法を提案し、計算機実験により有効性を示した。
さらに、FDHQに基づくストリームデータに対するk-匿名化手法を提案した。提案手法においては、l-多様性を考慮したk-匿名化も実現できるようにした。提案手法をプログラムとして実装し、計算機実験により提案手法の有効性を示した。

  • 研究成果

    (1件)

すべて 2020

すべて 学会発表 (1件)

  • [学会発表] 高次元データに対する近似最近傍探索手法とストリームデータに対するk-匿名化への応用2020

    • 著者名/発表者名
      山吉勇輝
    • 学会等名
      第12回データ工学と情報マネジメントに関するフォーラム

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi