数据的开放、共享甚至是交易和流通,是万物互联时代一个非常重要的要素。潘多拉星球运行的一个核心模式便是信息数据的交流和共享。生态体系可以便捷地汇聚所有个体的信息,个体在生态网络中进行信息的共享,同时生态系统也根据个体上传的信息数据不断地进化,这是大规模协作和协同发展的基础,也是整个生态保持发展的基础。
回到现实世界,在万物互联的时代,海量数据汇聚到一起,逐渐成为互联网新经济形式下的驱动力。以大数据为基础,全球数以千万计的网商平台、商业生态实现了精准营销和智能进化,从而催生了智能商业时代。
无可非议,在智能商业时代,数据所带来的影响力将不亚于甚至超过土地、劳动力和资本三大生产要素,成为不可替代的第四大生产要素。
但是要注意的是,大数据时代强调的不是“大”,而是“活”,即判断一个数据是否有价值,主要的判断标准是这个数据是否被活用。显然,让数据产生最大化价值,开放与共享是最佳的途径。信息使用的边际收益是递增的,信息流动和分享的范围越大,创造的价值就越高,而线上/线下数据化和数据开放正是信息大范围流动的两大前提。推动数据开放和流动在发达国家已形成共识,美国和欧洲多个国家通过国家战略为数据开放背书。自从“互联网+”上升为我国国家战略后,中央不断加大力度推动数据开放,在地方政府和产业界的带动下部分地区已经做了诸多有益的尝试。
同时,我们关注到“活”的数据往往是在线的,未来的商业数据是自然记录下来的,而不再是一个“收集”的概念。在线的数据才能实现实时处理,才能支撑互联网上每一秒数以万计的交易。比如淘宝,用户在淘宝上浏览和购物的记录被实时记录下来,系统将信息与商品进行匹配,为用户推荐他所心仪的物品。同时,淘宝商家也可以根据用户数据优化自己的商品,而淘宝商家的行为也会被记录下来,实时传递给厂家以及时调整生产。
在这个时代,数据和业务是一个有机的闭环。以谷歌公司为例,作为搜索平台,其主要目标是做出一个全网实时数据的索引,同时做出一个排名,即对所有网页内容,根据搜索要求进行排序匹配,谷歌公司最有名的研发成果就是PageRank。谷歌没有数据收集的过程,它的数据由用户的每次点击来决定。当用户通过谷歌平台点击相关内容时,就会成为搜索数据变化的依据。原则上,用户搜索一个关键词,一个小时前后得到的结果是不一样的。因为用户的点击行为已经对数据产生了影响,数据进行了动态更新,形成了一个新的结果。这是一个实时的在线系统,一个完整的业务闭环。
“活”数据的形成和应用与云计算的发展密切相关。云计算的发展目标是以低成本、商业化的模式来解决大计算的问题。在此基础上,海量的数据才能实时匹配各种场景,支持商业应用。如果没有计算能力,我们谈不上大数据时代,更不用说海量数据的高效应用。
分布式和去中心化是云计算的两大特征,与之相匹配的是分布式数据库,即将尽可能多的通用服务器联网,以提供一个足够好的运算服务。任何一台服务器都有宕机的概率,但机群可以对这个宕机进行控制,工程师不需要时时刻刻忙着解决硬件故障,而只需定期更换损坏的服务器。
可以预见,随着互联网技术的发展,我们距离万物互联的时代越来越近。在这个时代,分布式网络特性将更加凸显:点对点间的影响通过网络形成了非线性因果关系,没有强制性的中心控制,次级单位具有自治性质,次级单位之间彼此高度连接。
以此为基础,在互联网商业形式中,点对点的经济模式将得到最大限度的发展,同时急需建立一种全新的、能全面适用于互联网经济的信任机制。