2019 Fiscal Year Annual Research Report
オープンデータ社会におけるプライバシ漏洩リスクの特定と保護基盤
Project/Area Number |
17H04705
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
清 雄一 電気通信大学, 大学院情報理工学研究科, 准教授 (20700157)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | プライバシ / オープンデータ |
Outline of Annual Research Achievements |
ソーシャルメディアのユーザは、匿名の場合や、実名でも病気等の機微な情報を伏せる場合が多い。しかし、オープンデータと紐付けされることで、個人特定や、個人属性値漏洩につながる恐れがある。日本でも個人情報保護法改正やオープンデータ戦略により、匿名化された個人情報や統計データをオープンデータとして公開して共有することが促進されている。 これまで、病院等の閉じた世界で管理された、データや属性値を明確に規定しているデータベース上での匿名化の研究が盛んに行われている。しかし、オープンデータを併用してプライバシ情報を推測されるリスクについては明らかになっていない。 今年度はリンクトオープンデータ;Linkd Open Data (LOD)を対象としたデータ解析アルゴリズムの改良を行った。LODとしてDBpedia(Wikipedia)の情報等を使い、データとデータの意味的な距離を考慮した上で、コンパクトにある主体を表現する枠組みを提案しており、アプリケーションを公開した。また、プライバシ情報の意味的な差異を考慮したデータ分析アルゴリズム(セマンティック l-多様性)を開発していたが、今年度はこれまでよりもデータの意味的損失を抑えながら、プライバシ保護レベルを維持する新しいアルゴリズムを提案した。指定されたプライバシ保護レベルを維持できることについては数学的な証明を行い、有用性の向上についてはシミュレーションを多数行うことにより確認を行った。この成果は国際ジャーナルに採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
一部変更があるものの概ね計画通りの進捗が得られているため。
|
Strategy for Future Research Activity |
・オープンデータ分析手法の提案 オープンデータ間の関係性を明らかにすることによって、分析精度を向上させる。これにより、プライバシ漏洩につながるデータの所在を突き止める精度が向上することが想定される。 ・機械学習モデルへの攻撃に対するセキュリティ手法の提案 オープンデータを用いる機械学習(サポートベクタマシンや深層ニューラルネットワーク)に対する攻撃手法の分析及び、その攻撃による影響を緩和するアルゴリズムの開発を行う。特に、訓練データそのものを悪意を持って改ざんするデータポイゾニング攻撃を対象にする。 ・プログラムの整備及び公開 これまで開発したプライバシ保護手法を実現するためのプログラムを整備するとともに、他研究者も利用できるよう公開する。
|