引言
在我们平时生活或者工作中常常会使用或者看到别人使用数字来说明问题,比如这个月部门出勤率达到95%、XX城市房价上涨了10%等等。
这样通过数字形式表现出来的证据会给人留下深刻的印象,因为数字使证据看起来非常精确、科学,让人感觉似乎这就代表着“事实”。然而,数据可以并且经常欺骗大家!表明上它们很有说服力,事实上却不一定。
这篇文章主要提供一些普遍的、广泛使用的策略,你可以通过这些策略来查明统计数据的欺骗性。
第一个策略:了解数据从哪儿来的
尽可能多地了解信息传递者如何获得这些统计数据的。因为统计数据往往只能是基于事实做出的一些估计。而这些估计有时候很有用,但它们也可能有欺骗性。比如统计数据时人们是否愿意提供真实想法、调查卷的设计是否合理等等,这些都会影响数据的准确性。
第二个策略:警惕平均数
当你看见表示“平均”的数值时,都应该想想:“采用算术平均数、中数或众数是否有差别?”
因为不同平均数的含义可能会改变已知信息的意义。除了思考采用哪种平均数,同时最小值和最大值之间的间距(即数据的范围)、每个数据出现的频率(即数据的分布)也同样重要。
作者提供一个例子,当你想通过一些信息来决定是否吃从邻近海洋里捕捉到的鱼。如果仅仅告诉你那些鱼的平均汞含量肯定是不行的,你还应该知道汞含量值的范围就是汞含量可能达到的最高值和最低值,以及不同含量值出现的频率。因为有可能所算出的平均数是在“安全”标准内,但是有10%的鱼汞含量高于“安全”标准。
第三个策略:根据结论,思考需要什么数据,对比差别
也就是不去看信息传达者的统计数据,并问自己:“哪种统计数据有助于证明信息传达者的结论?”然后,将所需要的统计数据与信息传达者给出的统计数据进行比较。如果这两种数据不匹配,你就可能找出了一个统计数据上的谎言。
第四个策略:根据数据,思考得出什么结论,对比差别
不要看信息传达者提出的结论,而是仔细审查作者所使用的统计数据,然后问问自己:“由这些统计数据得出什么结论是恰当的呢?”接下来,把你得出的结论与作者的结论进行比较。如果你发现它们的区别,说明你已经发现这个信息传达者是如何运用统计数据来撒谎的。
第五个策略:检查是否存在遗漏信息
统计数据的不完善,会得出有误导性的结论。所以作者建议在你判断出统计数据的影响之前,还需要确定是否需要其他进一步的信息?有没有什么相关信息被忽略了?
比如,相比上个月部门迟到人数减少了80%。这里就有信息被忽略了,即计算出这个百分比的基础——绝对数值。同样是减少80%,从50减少到40与从5减少到4,这能一样吗?
当统计数据在讨论某些问题,尤其是关于健康危险的问题时,普遍的作用是报告某种干预能使危险“相对”减少的效果,而遗漏了用“绝对的”术语报告,这之间的差别可能极大地影响我们对危险减少的真实程度的知觉。
总结:
信息传达者常用统计数据来支持他们的推理。统计数据也往往被看作有力的证据。然而,统计数据很多时候被误用,因为人们常使用一些有问题的统计数据,所以确认统计数据是否存在问题非常重要。当你决定接受还是拒绝作者的结论时,需要更加小心。
评估统计数据的线索:
1、尽可能地找出你所知道的这些统计数据是如何得出来的。问问:“作者是怎么知道的呢?”
2、注意作者所使用的平均数的类型;
3、小心证据和结论不想符合。
4、不看作者的统计数据。将你认为所需要的统计数据与作者实际给出的数据进行比较;
5、根据作者给出的统计数据,得出你自己的结论。如果与作者的结论不匹配,说明可能有什么地方出错了。
6、看看哪些信息被遗漏了。特别要小心那些易使人误解的数字、百分比类比。
注:文章主要参考《学会提问》第十一章