不管是大数据时代之前还是在数据时代,面对公众的数据都是小数据,这些数据一般都是统计后的数据。这些数据事实大部分是不可信的,为什么这么说呢?
第一,部分数据是由一些不合理的统计或挖掘方式得来,主要体现在统计的机构不权威,统计的数据不全面,统计的方法不合理等等。通常,这类数据都是由于某些机构过度的关注获得自己在这些数据中提现的地位,比如排名等,而没有太在意数据的真实与合理性;
第二,部分数据的解读存在一定的扭曲,主要体现在媒体的曲解,公众对于数据的解读易于趋向因果关系。媒体一般为了获得更高的关注,往往夸大数据所提现的效应,甚至故意曲解数据。同时,当公众看到一组相关的数据时,特别容易联想到因果关系,这也是由于大脑的快系统所造成的,而实际上这些数据只是提现了一种相关关系或根本没有关系,是公众自己联想所得。比如,夏天冰淇淋的销量增多,出现溺水的情况也增多,你就不能说吃冰淇淋导致溺水的因果。当然,这个案例还是很明显的,一般人也不太会出现这种错误的联想。但实际生活中可能就比较常见。
面对繁多的统计数据和报告,我们要有自己的解释,要学会去理解数据背后的机理,不能盲目相信和跟风。真相是在数据背后,而不是数据本身。