匿名情報からの個人特定手法に関して,下記の検討を行った. (1)ソーシャルメディアの投稿文の発信元を特定する技術を検討した.本技術は,ソーシャルメディアの匿名の発言(たとえば内部告発)を,社員等の履歴書と照合することで,投稿者を特定する.平成28年度には,履歴書中の属性(住所,学歴等)毎に機械学習によって識別器を生成し,複数の識別器の結果を線形結合によって統合する手法を検討した.29年度には,複数の識別器の最適な統合をアダブーストによって学習する手法を検討し,60%の精度の個人特定を可能にした.本技術は,いじめ発言やフェイクニュースの発信元の特定にも応用可能である. (2)WiFi基地局を通じて取得した移動経路をソーシャルメディアの投稿文と照合することで,同一人物による移動経路と投稿文を検知する技術を検討した.本技術は,移動経路から個人毎の移動の傾向を学習し,投稿文中に出現する地名と比較することで,65%の精度の検知を可能にした.本検討を上記(1)の検討と合わせることで,移動履歴とソーシャルメディアと履歴書の3者間照合により,移動履歴から個人特定が可能となる. (3)WiFi通信事業者との契約を経て,訪日外国人観光客160000人の移動履歴を入手し,移動の傾向から個人の属性を推定する技術を検討した.代表的な5つの機械学習法を用いた評価の結果,人数の多い8か国のなかから45%の精度で国籍を特定,10代から60代までの6年代のなかから25%の精度で年代を特定することができた. なお,以上の(1)から(3)の検討において被験者の個人情報(履歴書,移動履歴など)を扱う際には,所属大学の倫理審査を受け,取扱者を限定するなど細心の注意を払った.
|