ソーシャルネットワークデータの分析は多くの企業や研究者によって要望されているが,そのデータには個人情報が多く含まれているため,匿名化手法が必須である.従来研究ではグラフ匿名化が数多く提案されているが,申請者はグラフ匿名化を単に適用しただけでは脆弱性があることを指摘してきた.それをもとに,グラフによって表現されているユーザ間の関係およびユーザとコミュニティやアクティビティの関係の意味論を考慮した匿名化手法が必要であることを提起し,その匿名化手法を提案する.また匿名化手法とそれを用いたマイニング手法を実装し,個人情報に配慮したソーシャルデータマイニング環境として公開する.今年度は既存の匿名化の1つであるk-neighbor匿名化手法の既存アルゴリズムがノード間の距離関係を大きく変化させてしまい,それによってユーティリティが著しく落ちてしまうことを指摘した.また既存アルゴリズムを改良することで距離関係の変化を抑制される手法を提案した.これにより匿名化後のグラフ構造のユーティリティを向上させ,匿名化のデータ分析に対する有用性を向上させることができた.
|