• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

A Study on Reduction of Information Loss and Improvement of Performance of Anonymization Processing for Streaming Data

Research Project

Project/Area Number 17K00188
Research InstitutionHiroshima City University

Principal Investigator

若林 真一  広島市立大学, 情報科学研究科, 教授 (50210860)

Co-Investigator(Kenkyū-buntansha) 上土井 陽子  広島市立大学, 情報科学研究科, 講師 (80264935)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywordsストリーミングデータ / k匿名化 / 近似最近傍探索 / FDH / FPGA
Outline of Annual Research Achievements

ストリーミングデータのk匿名化の効率的な実現には、高次元データ集合を対象とした近似最近傍探索手法が不可欠である。このため、2018年度は高次元データ集合を対象とした近似最近傍探索手法の研究開発に注力した。本研究では、近似最近傍探索手法としてFlexible Distance-based Hashing (FDH) に着目した。FDHは高次元データ空間をアンカー集合と呼ばれるk個のデータ点からの距離によって2^k個の部分空間に分割し、それぞれの部分空間にビットマップと呼ばれる2進数を割り当て、ビットマップをハッシュ値とすることで与えられたクエリに対する近傍部分空間に含まれるデータ点集合を高速に探索する近似最近傍探索手法である。
本研究では従来のFDHに2種類の拡張を導入することで、計算時間の短縮と探索精度の向上を実現した。1つ目の拡張は最遠δ近傍を導入することにより、探索精度を保ちながらクエリに対する探索部分空間を制限することで計算時間の短縮を実現した。もう1つの拡張は、従来のFDHではアンカー集合は1種類であり、与えられたクエリによっては最近傍データを見逃す可能性があったが、アンカー集合を複数個に拡張することで最近傍データを見逃す可能性の低減を図った。
提案した拡張FDHをプログラムとして実現し、計算機実験により従来のFDHとの比較を行った結果、提案手法は計算時間の増加を防ぎながら探索精度の向上を可能にすることがわかった。また、最遠δ近傍を導入したFDHをハードウェアとして設計し、FPGA上に専用回路として実現した。さらに、シミュレーションにより提案ハードウェアの性能を評価し、ソフトウェア実現よりも効率よく最近傍探索を実現できることを示した。
提案した拡張FDH、および最近傍探索専用ハードウェアについては、2回の国際会議と1回の国内シンポジウムで発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究では、ストリーミングデータのk匿名化をテーマとしているが、k匿名化を実現するためには効率がよく探索精度の高い近似最近傍探索手法が不可欠である。このため、2018年度はFlexible Distance-based Hashing (FDH)に基づく近似最近傍探索手法に着目し、その改良を行うことに注力した。当初の研究計画とは若干、進捗が異なっているが、近似最近傍探索手法の改良は本研究において非常に重要であるため問題はないと考えている。

Strategy for Future Research Activity

2018年度においてFDHに基づく近似最近傍探索手法については一定の研究成果が得られたため、2019年度においては、改良した近似最近傍探索手法に基づいてストリーミングデータのk匿名化を実現することを予定している。
また、他のデータと属性値が大幅に異なるデータ(特異データ)が入力された場合、特異データを通常どおりに匿名化すると情報損失の大幅な増大を招くため、特異データを検出する処理を匿名化処理に組み込むことも予定している。さらに、提案手法をマルチコアCPUを用いて実現することで,提案手法の高速実行を可能にする。
得られた研究成果は国内外の学会等で発表すると共に、学術雑誌に論文として投稿することを予定している。

Causes of Carryover

2018年度は旅費の支出が予定を下回ったため。また、謝金の支出の必要もなかったため。

  • Research Products

    (3 results)

All 2019 2018

All Presentation (3 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] Flexible Distance-based Hashingに基づく大規模多次元データ集合に対する近似最近傍探索手法の改良2019

    • Author(s)
      糸谷 友里
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム
  • [Presentation] An Approximate Nearest Neighbor Search Algorithm Using Distance-Based Hashing2018

    • Author(s)
      Yuri Itotani
    • Organizer
      29th International Conference on Database and Expert Systems Applications (DEXA 2018)
    • Int'l Joint Research
  • [Presentation] A Nearest Neighbor Search Engine UsingDistance-based Hashing2018

    • Author(s)
      Yuri Itotani
    • Organizer
      2018 International Conference on Field-Programmable Technology (FPT)
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi