从公司的数据统计出发看信息隐私

最近公司技术上日益稳定,然后就开始追求其他方面的利益挖掘,日志处理这块就一个统计作用,却花费了相当比例的计算资源,包括zookeeper集群,kafka集群,storm集群,花了那么多钱在日志处理上,加上互联网已炒上天的大数据处理,挖据数据价值自然成了最大的方向。

数据挖掘是个好方向,问题是如何继续挖掘潜在价值呢?我们是一家第三方的视频流媒体云服务公司,给客户提供各种平台下的SDK,在SDK里面我们可以非常自由地定制化我们的统计内容,甚至在每个客户端永久保存一个UUID以唯一标识一个用户,但一个UUID仅仅是一个字符串,我们不知道它所对应客户的性别、年龄等信息?少了这些信息,又如何仅根据这些UUID提取特征,聚类分析,然后个性化推荐呢?已知的不过是该UUID看了那些视频而已,仅仅根据这个的数据挖掘真是十分单薄。

那又如何得到客户的这些信息呢?最简单暴力的方案是让用户自己填写上报,那就要求应用方有完整的用户画像系统,这对应用方还是有可能的,但我们是第三方云服务公司,实在没这个能力。倘若应用方有用户画像系统的话,我们倒也有可能与应用方双边合作。好吧,你还有什么更好点办法吗?有,那就是收集用户的手机号,想到手机号你是否眼前一亮了吧,bang,手机号,有了这玩意,与移动联通的用户数据库一对,那该手机号的机主是谁,多大了,一目了然,哈哈哈。。。翘得,你一第三方云服务公司,哪来的能力获取手机号,要知道手机号等都属于隐私信息,万一你不靠谱把我的手机号泄漏给卖保险的呢?而且要获取这个,应用要明确向用户申请权限,作为一个有节操的应用,才不会向用户收集任何隐私呢!那这种方法,就只有一些hack大公司,一些很早之前就开始收集这些信息的应用,一些手机厂商能获取到了,相信谷歌、百度、腾讯都掌握着我们每一个用户的详细信息,要不他们怎么会大口气宣布他们颇具野心的计划,那就是未来数据建议着、控制着你的生活。而其他公司受限于道德舆论和用户习惯,自然是小心谨慎。另一方面,就算你拿到了这些信息,也要有个大公司能和你对数据才行啊。TT。。

然而,讽刺的是,用户本不希望一些除了微信等应用的其他应用不要获取自己的隐私信息,但是法律上面明令应用注册用户要实名制,聪明如你的用户是否也发现应用经常以手机号注册,以手机号登录呢,那其实你的信息从使用应用注册那一刻起,你的姓名、年龄、地址等信息都能被应用方从其他渠道合法地取得!额,隐私这个词对用户来说又有多大的意义呢

答案当然是没有意义。探讨到这里,其实只是一个老生长谈的话题了。接下来开放性的,扩展性地聊一聊这里面的问题与矛盾。那问题是什么?问题就是用户隐私的最主要担忧是手机号泄漏给骚扰电话组织,其实应用无论如何都能获取它想要知道的用户的一切,而且产品经理还会让工程师前方百计地去获取这些信息,以提供更加个性化的优良体验,就看应用方有没有操守了。另外一点,那就是如今的现状,论信任,这些信息掌握在几个靠谱的大公司手里最好,用户当然这么想。唉,谁让你最先不开发用户手机号的价值呢,现在是没得机会了。OK,你知道了以上痛点,你又能想到何种解决方案来化解这个矛盾呢?这才是出发点!