2020 Fiscal Year Annual Research Report
オープンデータ社会におけるプライバシ漏洩リスクの特定と保護基盤
Project/Area Number |
17H04705
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
清 雄一 電気通信大学, 大学院情報理工学研究科, 准教授 (20700157)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | オープンデータ / プライバシ |
Outline of Annual Research Achievements |
ソーシャルメディアデータを対象に、個人のプライバシを攻撃するなど不当かつ一般的でない語句を検出する手法の提案を行った。一般的な語句を含むデータから生成したコーパスと、攻撃を行っている可能性が比較的高いデータから生成したコーパスを用意し、同一語句でありながら各コーパスでの利用のされ方が異なる語句を抽出する。実際にTwitterデータを対象に実験を行い、高い精度で語句を抽出できることを示した。 また、オープンデータとして個人にかかわるデータを公開する場合、全てのデータを公開するとプライバシ漏洩の懸念があるため、一部の情報(エンティティやエンティティ間をつなぐリンク)を削除する手法が広く利用されている。しかし、これらの削除された情報を復元する攻撃が存在する。エンティティの関連性を基に効率よく削除されたリンクを推測するアルゴリズムを提案した。具体的には、データ同士を関連づけてグラフ形式で記述するナレッジグラフを使用し、知識をモデル化するための表現プリミティブであるオントロジーの構築とそれに基づいたナレッジグラフによるデータ統合を行った。 また、オープンデータを機械学習の訓練データとして利用する環境を想定すると、オープンデータとして故意に誤ったデータを注入することで、機械学習モデルの判定結果を不当に操作するPoisoning Attackという攻撃が存在する。この攻撃を緩和するための手法を開発し、既存研究と比べ柔軟な防御が可能であることを示した。
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|
Research Products
(44 results)