AI时代:匿名不等于隐私保护

镁客 8年前 (2016-06-22)

苹果在WWDC 2016的主题演讲中,讲到“差分隐私 (Differential Privacy)”这个密码学专有名词的时候,只有少数人意识到,苹果又走在了时代前列。

苹果独辟蹊径!“差分隐私”完爆匿名搜集数据

匿名电话、匿名信息、匿名用户••••••“匿名”仿佛已经成为隐私安全的防护栏。

然而在AI时代,匿名真的能保护隐私安全吗?来看看苹果怎么说!

在 WWDC 2016 的主题演讲中,当苹果讲到“差分隐私 (Differential Privacy)”这个密码学专有名词的时候,只有少数人意识到,苹果又走在了时代前列。

但是大部分中外观察者都认为,苹果为人工智能时代所做的努力不够,它依然是一家以硬件设备为核心的公司,对于为更大规模的用户提供服务不感兴趣(例如 iMessage 等软件均没有 Android 版),所以当人工智能技术得以真正崭露头角的时候,很可能难以追赶 Google、Facebook、亚马逊和微软。

从这个方面来说,苹果确实不如Google、Facebook等行业巨头,但是苹果在解决人工智能时代的隐私保护难题上,又似乎比其他科技巨头走得更远。

在发展的需求方面,人工智能依赖于机器学习(深度学习)算法,而机器学习又需要大规模的训练数据,所以向用户搜集数据比以往更加重要。这也是搜集数据的原始意图。互联网时代,搜集数据主要以匿名为挡箭牌,但AI时代,匿名还可靠吗?

匿名VS差分隐私

有句话说得好,“内行看门道,外行看热闹”。互联网行业搜集信息的标准答案:一、收集用户信息是必要的,这样有助于改善产品或服务。二、我们是匿名收集用户信息的,并不保存任何用户的身份信息。有了这个挡箭牌,外行很容易被唬住,认为匿名就联系不到用户信息。

但是内行都应该清楚,匿名并不能完全保证用户的隐私安全。最经典的案例莫过于,Netflix 曾放出“经过匿名处理的”上亿条电影评分数据,“仅仅保留了每个用户对电影的评分和评分的时间戳”,希望通过竞赛的形式,找到更好的影片推荐算法。但是 2009年,德州大学的两位研究人员,通过这些匿名数据与公开的IMDB数据做对比,成功将匿名数据与具体的用户对应了起来。Netflix 不得不取消了,这项原计划每年举行的竞赛。

这样的匿名还有的玩?必将寿终正寝啊!

这不,拯救AI时代隐私保护的高手出场,“差分隐私”通过苹果高调亮相!其实差分隐私不是苹果的首创,因为学者们已经就这个概念进行了多年的研究。但当苹果将它随着 iOS 10 一起发布后,差分隐私就将走进人们的视野里,帮助公司收集和分析不同来源的用户数据。

这项密码学前沿技术的基本原理,就是向包含个体信息的大量数据集里注入噪音(或者说扰动),通过算法来打乱个体用户数据,让任何人都不能凭此追踪到具体的某一名用户,但又可以允许机构成批分析数据以获得大规模的整体趋势。最终保证每个个体信息都无法泄露,同时这个数据集的统计学信息依然可以被外界分析。

这简直甩了“匿名”好几条街啊!苹果此举,可谓是不鸣则已,一鸣惊人。

差分隐私的未来前景如何?

差分隐私并不是某一项单独的技术,而是一种以避免在数据与特定个人之间建立联系为前提的数据处理方案。它允许数据以聚合的形式被分析,但同时还要将干扰注入那些数据中,使得处理数据的过程中个人隐私不会被侵害。

但是强调安全性是有代价的,在加入这些干扰因素之后,获取的信息就不会有那么清晰和准确了。在这个取舍之间,苹果毫不让人惊讶地选择了注重隐私。很明显,苹果遵守了注重隐私的承诺,利用自己独特的方式在AI大战中首次告捷!

苹果将成为第一个真正大规模使用这项“差分隐私 (Differential Privacy)”算法的公司。即便有些学者认为这项技术前景可期,还没有成熟到大规模商用的时候。但差分隐私的引入仍将会为我们带来更好的体验,让更多的人摆脱匿名的“欺骗”。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到