跳转至

Vol.118 你的 App 对你的隐私做了什么?

当你注册微信的时候,你需要阅读一份8300个字的隐私协议,必须勾选我已阅读,并同意上述条款,才能进行下一步。

但我们都知道,其实你并没有读,也不知道你究竟同意了什么条款,理论上只要你同意你的APP里填写的住址、电话号码、聊天记录、手机里的通讯录、照片、短信、通话记录,都可以被APP们自由的采集和分析。他们对你的隐私数据到底做了什么?

首先我们要知道APP究竟能采集到你的哪些信息,在安卓提供的开发者文档中,我们可以把APP能获取的权限分为普通权限和危险权限,普通权限有140项,不需要经过用户同意就可以获取,比如控制你的震动传感器和锐利数据,而更敏感的危险权限则分为9组,比如录制音频、读取短信、访问照片等等,而这些授权基本都是一次性的,比如你需要通过APP发送语音,打开了麦克风权限,那么这个APP理论上是可以一直在你的使用过程中录音的。

这时我们就需要分清APP权限和APP采集的数据,在大多数APP的隐私协议里都会说明他们不会偷听和偷看,但你使用麦克风时就不好说了。比如这份卫报2019年7月的报道中,苹果会对1%的用户采集他们和siri几秒的对话录音,用于改善siri的识别准确率,但除了这种用来改进产品的情况,目前并没有证据可以证明,APP会偷偷上传分析你的录音或者照片。

你的数据更常见的用途是生成给分析师和广告主的用户画像,比如微信就知道00后和60后最爱的表情包,知道90后每个月做25次公共交通,而我们这样的视频创作者也可以在后台看到观众的性别比例、年龄比例、使用设备和地域分布。

互联网公司可以这么做的,前提是你同意了这一切,虽然你很可能没看过,但他们要守住的底线是不能通过大数据反推出你的个人信息。

举个例子,假设我们有100个关注者在后台,我们可以看到50%来自广东,40%来自江苏,10%来自湖北。

这时如果我们移除一个关注者美阳,剩下99人的地域比例就变成了50.5%、40.5%和9%。这样美洋的隐私就暴露了,我们可以轻易的推算出他来自湖北。解决这类问题的常见方案是差分隐私。差分隐私的核心思想是对数据加入噪声,让有没有美羊都输出差不多的结果,无论关注者是100还是99人,来自湖北的观众比例都有可能是9%、10%、11%。但另一方面噪声也不应该乱加,不然数据也就没有参考意义了。

最常见的噪声算法是拉普拉斯噪声,拉普拉斯是一种常见的连续概率分布,位置参数等于0的情况下,大概长这样,b是尺度参数,可以看到b越大,拉普拉斯分布就越扁平,数据波动的幅度越高,而在原数据的基础上加上的拉普拉斯噪声大,小则取决于这两个参数。

敏感度,这台f和提前设置好的隐私预算epsilon,简单来说这台f就代表有没有美洋对最终结果的改变数值,用德尔塔f除以隐私预算就能得到拉普拉斯中的尺度参数,所以如果这两个数据集的差距越大,敏感度得到f就越大,分布越扁平,这样加入的噪声可能就很大,让两个数据及输出类似的结果,如果数据级差距不大的台服就小输出的噪声很可能就接近为0,不影响数据可用性。

相比外部攻击更常见的是内部泄露,从经营范围到法人身份证号码,所有的信息应有尽有。

根据警方的调查,大量的证据都指向了市工商局信息档案中心负责管理档案的刘某,在这个问题上,互联网公司的做法通常是考证,其中最重要的是 ISO27001 作为全球公认的最高信息安全标准。

ISO27001 包含了信息安全、人力安全、物理安全在内的14个模块,完成这一套认证耗时耗力,需要评审机构通过访谈、抽样、现场观察等方式完成近100项内容的审查。比如抽查员工的电脑桌面是否有敏感信息、电子文档,是否有保密等级,入职员工的保密协议等等。

2014 年 ISO27001 的基础上提出了270、181向在隐私问题上更严格的扩展标准,像百度、网盘这样的企业,就需要搭建数据保护权限、系统、数据脱敏处理算法等更复杂的隐私保护体系,这也意味着你的APP为了保护你的隐私得花更多钱。

在中国也只有bat这样的大厂旗下的产品,比如百度、百度、网盘、阿里云等服务通过了这两项认证,这样我们才可以说我们的数据是相对安全的,但这并不意味着你的数据就绝对安全。

今天所有的隐私协议里都会写着例外情况,比如跟卡图网拍一次协议,在这11种情况下收集使用你的信息,就无需征求你的同意了。

比如你上传的色情片,很有可能因为刑法第 364 条传播淫秽物品罪,被认为与公共安全或犯罪侦查相关,进而让你的隐私不被保护。在这份 2018 年的判决书中,来自安徽的陈先生就在百度网盘上上传了 189 部色情片,在淘宝以公司男女同事为人相处方式的奥秘高清教程视频设计素材为名进行销售,被判处有期徒刑三年8个月。

但如果你上传的是其他文件,百度还是会试图保护一下,比如在这场持续三年长达 21,000 字的判决书中,百度网盘为了保护用户隐私,坚持不删除用户存在网盘里的电视剧匆匆那年的资源,在一审中被判赔偿50万元!

然而在二审中,百度辨析的存储和传播这两个概念,在不干涉用户存储隐私的同时,百度也会积极切断盗版内容的传播路径,从而奇迹般的逆转了判决。连4万元案件受理费都让从那年掏了。

我是吴松磊,如果你喜欢本期节目请转发支持我们,你可以在微博、微信、B站、YouTube、微信搜索回形针PaperClip关注我们,在我们公众号后台回复隐私,可以获取本期节目当中用的几份文件,我们下期节目见。