过去的三月份是令数据行业“颤抖”的十天!
3.15虽然只曝光了几家小公司在数据采集和交易过程中的个人用户隐私数据泄漏事件,没“敢”动那些大鱼大虾,但是“数据隐私”和“数据安全”这柄“宝剑”确一直悬在各类数据公司,特别是“数据寡头”们的头上。此剑一旦落下,损失的并非只是“钱财”,更加宝贵的是各个公司高层管理人员的“人身自由”。“巧达科技因为上亿未授权简历数据爬取而导致全员被警方带走”的新闻则是上述担心的注脚。
一般是海水,一半是火焰。
好消息来了,2018年3月25日,杭州数据智能企业——浙江每日互动网络科技股份有限公司正式登陆创业板,这家公司有个别称“个推”,这是目前国内第一家“大数据”上市公司。再算上2018年在美国上市的极光(JG),成为第一家上市的中国大数据公司。做大数据公司不仅仅是被“数据隐私”问题“紧箍咒”的对象,也是被二级市场投资人追捧的对象,“个推”上市当日涨幅超过44%,一个“独角兽”就此诞生了。
冷静下来想想,大数据公司如此光鲜的背后是否都隐藏着“数据隐私”的隐忧呢?答案:是的,所有“大数据”公司,只要涉及个人用户的隐私数据,都或多或少,或深或浅,被这个问题困扰着。那么数据公司们如何解决这个问题呢?
我们先看看大数据公司的一般业务流程是怎样的。
首先,无论是做2C业务,还是2B业务,都要将大量的个人用户数据沉淀到自己公司的服务器上,而且可以肯定的都是明文数据。做的好的,会想方设法拿到个人用户对于数据的“授权”,没有用心的干脆只管获取数据,爬取数据,甚至去“黑色市场”或者“灰色市场”购买不明来路的数据。来为自己的业务提供数据支撑。
其次,各家数据都有自己的优劣之分,哪怕是数据寡头,如阿里,也不敢说自己的数据最全,即便是阿里最擅长的用户购物行为数据(因为还有京东商城”,抑或是金融信用数据(毕竟还有“央妈”的央行征信)。大家都是各有自己的一块数据“自留地”,整个行业就形成了一个个的“数据孤岛”。如果想在某个垂直领域,比如:信贷风控,对用户建立一个完整的征信画像,就需要“采购”或者“合作”其他家的数据。
好了,问题就出在第二步。无论是花钱还是不花钱,获取用户的“明文”隐私数据都存在巨大的法律和合规风险,而如果大家都对数据做加密处理,再做传输,如何采用同一个加密方式;在统一加密方式下,如何保证不被反向破解?
最好的方法应该是利用“同态加密”和“对方安全计算MPC”等加密手段,并且结合区块链之联盟链的共识协议,借用通证的激励机制,实现机构间,乃至个人与机构间,隐私数据,特别是“个人隐私数据”的“可用且不可见”操作。这一方案已经在金融和精准营销领域落地和实施。
类似于上述说法的团队和公司并不鲜见,最早可以追溯到2016年,可多数都是理论层面和科学模型搭建环节,真正可以结合某个行业的现实问题并能够提供落地可以执行的解决方案者,确实乏善可陈,到目前为止,仅有一家半。
革命尚未成功,同志仍需努力!