算法能从“匿名化”数据库里识别身份

许多公开的数据通常会经过匿名化处理,也就是剥离了个人身份信息。但计算机科学家发现,所谓的匿名化其实并没有真正匿名。伦敦帝国理工学院和鲁汶大学的研究人员在《Nature Communications》期刊上发表报告,他们开发出一种算法能以 99.98% 的正确率利用包含性别邮编等公开数据识别美国人的身份。研究人员还公开了用 Julia 和 Python 语言实现的代码。这并不是第一次发现匿名化数据并不是真正匿名。

发表评论

电子邮件地址不会被公开。 必填项已用*标注