ソーシャルメディアのユーザは、匿名の場合や、実名でも病気等の機微な情報を伏せる場合が多い。しかし、オープンデータと紐付けされることで、個人特定や、個人属性値漏洩につながる恐れがある。日本でも個人情報保護法改正やオープンデータ戦略により、匿名化された個人情報や統計データをオープンデータとして公開して共有することが促進されている。これまで、病院等の閉じた世界で管理された、データや属性値を明確に規定しているデータベース上での匿名化の研究が盛んに行われている。しかし、オープンデータを併用してプライバシ情報を推測されるリスクについては明らかになっていない。 今年度はオープンデータによるプライバシ漏洩リスクの整理を行った。また、リンクトオープンデータ;Linkd Open Data (LOD)を対象としたデータ解析アルゴリズムを提案した。LODとしてDBpedia(Wikipedia)の情報等を使い、データとデータの意味的な距離を考慮した上で、コンパクトにある主体を表現する枠組みを提案している。これは、ある主体に関するプライバシ情報を端的に抽出する手法に応用できる。また、プライバシ情報の意味的な差異を考慮したデータ分析アルゴリズム(セマンティック l-多様性)を提案するとともに、複数組織にまたがるデータ分析を行う際におけるプライバシ保護アルゴリズムの提案を行った。これら要素技術の開発を行うとともに、一部については国際会議等で発表を行った。
|