研究課題/領域番号 |
17K00188
|
研究機関 | 広島市立大学 |
研究代表者 |
若林 真一 広島市立大学, 情報科学研究科, 教授 (50210860)
|
研究分担者 |
上土井 陽子 広島市立大学, 情報科学研究科, 講師 (80264935)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | ストリームデータ / k-匿名化 / LSH / 近傍データ探索 / m-不変性 / FPGA |
研究実績の概要 |
本研究では、ストリームデータに対する匿名化処理に対し、データ管理にLSH(Locality Sensitive Hashing)を応用することで、情報損失の低減と匿名化処理の高速化を同時に実現する匿名化手法を開発する。提案手法においては、入力されたデータを一度バッファに格納し、匿名化処理を行った上で、入力順に匿名化データを出力する。バッファ内のデータに対する匿名化処理を前方匿名化、すでに出力された匿名化データに基づくデータの匿名化を後方匿名化と呼ぶ。提案手法ではこれら2つの匿名化をLSHに基づく手法で高速に実行する。 本年度の研究においては、LSHの一種であるFDH(Flexible Distance-based Hashing)に基づく近傍データ探索をk-匿名化手法に組み込むことで計算時間の短縮を実現する手法を提案し、提案手法をC 言語を用いてプログラムとして実装し、計算機実験によってその有効性を示した。 また、FDHに基づく近傍データ探索手法のハードウェア化について研究を行い、パイプライン処理と並列処理に基づく近傍データ探索ハードウェアを開発した。開発したハードウェアはFPGA上の専用回路として実現し、回路規模と計算時間の高速化についてシミュレーション実験により評価を行った。 さらに、挿入や削除が行われる動的データセットの再公開においてプライバシを保護する方法として、先行研究ではm-不変性が提案され、その安全性を評価する方法として全射関数を用いて確率的に評価する方法が提案されている。しかし、この安全性評価方法では、攻撃者に再公開表を作成したときの情報を与えることで、安全性評価値が上昇することがあることがわかった。本研究ではm-不変性を満たす時の動的データセットの再公開における安全性を厳密な確率によって評価する方法について考察し、その妥当性について検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
提案手法のマルチコアCPU上でのマルチスレッド実装までは行うことができず、シングルスレッドでの実装となったが、匿名化手法の情報損失に関する提案手法の有効性は確認できた。また、当初は平成30年度以降の予定としていたハードウェア実装については、匿名化手法の中心である近傍探索アルゴリズムのハードウェア実装を行い、評価まで行うことができたのは、当初の計画以上の進展である。これらのことから、研究はおおむね順調に進展していると判断した。
|
今後の研究の推進方策 |
k-匿名化手法の中心となるのは大規模高次元データ集合に対する近傍探索手法であり、平成29年度の研究において、優れた研究成果を得ることができたので、得られた研究成果をより発展させ、平成30年度もこの問題に対して研究を優先的に進めていきたい。その後、研究成果をオンライン匿名化手法に応用する予定である。
|
次年度使用額が生じた理由 |
備品としてワークステーションを購入したが、当初予定していた機種と同等の機能を持つワークステーションがより安価に購入できたため。次年度使用額については、備品および旅費として使用する予定である。
|