研究課題/領域番号 |
21J13050
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分60070:情報セキュリティ関連
|
研究機関 | 明治大学 |
研究代表者 |
伊藤 聡志 明治大学, 明治大学大学院先端数理科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2021-04-28 – 2023-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
1,500千円 (直接経費: 1,500千円)
2021年度: 800千円 (直接経費: 800千円)
|
キーワード | 匿名化 / k-anonymity / k-concealment / 位置情報データ / 世帯収入データ / 2部グラフ / 完全マッチング / 再識別 |
研究開始時の研究の概要 |
個人情報データから個人が特定されないようにデータを加工することを匿名加工といい,データ中の少なくともk人の区別がつかないように加工する「k-匿名化」手法が広く用いられている.しかしk-匿名化には,(1)kの値によっては顧客の削除やダミー顧客の追加が必要になること,(2)レコード数と顧客数が異なるデータを加工する際はレコードの削除やダミーレコードの追加が必要になること,といった問題点がある. 本研究では,顧客-仮名間の2部グラフを用いることにより,k-匿名化されたデータと同等の安全性を持ちながら,顧客の削除やダミーレコードの追加をしていない分有用性が高いデータの作成を目指す.
|
研究実績の概要 |
ビッグデータは利活用することによって大きな利益を生むことができるが,それと同時に非常に危険なものでもあり,データから個人が特定されてしまうリスクがある.個人を識別できないようにデータを加工することを匿名化といい,代表的な匿名化技術にk-匿名化がある.k-匿名化は,データ内の少なくともk人の個人の区別がつかない状態(k-anonymity)にデータを加工する手法であるが,kの値によってはある個人/レコードの削除や,存在しないダミー個人/レコードの追加が必要となる場合がある.しかし,顧客/レコードの削除やダミー顧客/レコードの追加はデータの有用性を大きく下げるため,これらを必要としないk-匿名化手法が必要である.本研究の目的は,個人/レコードの追加や削除を必要としない,最適なk-匿名化手法の提案である. 本研究では,この目的を達成するためにk-concealment指標に注目した.k-concealmentを満たすように加工されたデータは,k-匿名化されたデータと同等の安全性を持ちながら,さらに有用性を向上することができる.本研究では,データをk-concealment化するための3つのアルゴリズムを提案し,これらの性能を評価する実験を行った.その結果,巡回セールスマン問題の近似解法を加工アルゴリズムに応用できることなどが明らかになった,本研究で提案した手法を用いることにより,個人/レコードの追加/削除をすることなく,データを「少なくともk人の区別がつかない」状態に加工することができる.本手法はレコード数と個人数が等しいならばどのようなデータに対しても適応可能であり,なかでも近い距離に多くの個人が分布しているデータに対しては,クラスタリングを組み合わせると加工コストの向上が期待できる.上記の結果について,2021年10月に開催された学会であるCSS 2021にて発表を行った.
|
現在までの達成度 (段落) |
翌年度、交付申請を辞退するため、記入しない。
|
今後の研究の推進方策 |
翌年度、交付申請を辞退するため、記入しない。
|