统计数据经常因为不完整而欺骗我们。因此,另一个在数据推理中找到缺陷非常有用的策略就是问一问:“在你判断数据的影响力之前还需要哪些进一步的信息?”让我们先看看下面的例子,诠释一下这个问题所派的用场。
(1)大公司正在将市中心地带的小镇气息破坏殆尽。就在去年,城里的大公司的数目增长了75%。
(2)尽管大家都挺害怕,但跳伞运动其实比其他活动比如说驾驶汽车要安全得多。拿某一个月的时间来做比较,这段时间里,洛杉矶有176人死于车祸,而死于跳伞事故的却只有3人。
(3)艾滋病预防项目需要较大的资金投入。2009年,有54 000人饱受艾滋病的折磨。
第一个例子当中,75%这个数字显得很吸引眼球。但是缺少了一些东西:这一百分比所依据的绝对数值。假如我们知道这种增长是从4家增长到7家,而不是从12家增长到21家,我们还会觉得如此惊讶吗?在第二个例子里,我们倒是有数字了,但是却不知道比率。难道我们不需要知道这些数字对参加这两种活动的人数的百分比而言有什么意义吗?不管怎样,参加跳伞活动的总人数比起驾车的总人数而言简直是微不足道。
第三个例子展示了我们社会当中常见的一个事实,通过聚焦全国范围内受病痛折磨的总人数来企图引起公众对某个社会问题的关注。尽管这显然是个亟待解决的问题,但当我们将54 000除以美国的大概总人口数3亿,我们只得到一个大概2%的数值。
当你遇到听起来让人动心的数字或者百分比,一定要当心!你可能需要其他信息来判定这些数字到底有多让人动心!当只有绝对数值摆在眼前的时候,问一问百分比是不是有可能帮你做出更好的判断;当只有百分比出现在眼前的时候,问一问是不是绝对数值会丰富它们的含义。
另一个重要的有可能缺失掉的信息类型是相对比较(relevant comparisons)。问一下这个问题常常很管用:“这是和……相比较?”
下面每个陈述都展现了要求做比较会给统计数据带来的好处。
·美杜莎发胶,现在效果要好50%。
·运动型轿车很危险,不该让它们上路行驶。2006年,有4 650名车主死于运动型轿车事故。很显然,应该采取行动才行。
·电影预算这些年简直是骇人听闻。看看《哈利·波特与火焰杯》:这部电影的预算是308 000 000美元!
·我们的文化正在日益向弱智化靠拢,更多的证据包含在以下事实当中:最近《纽约时报》一篇文章说接受采访的年轻人中知道美国内战哪一年开始的人还不到一半。
说到第一个表述,我们难道不需要问一问:“比什么要好50%?”是其他没效果的发胶?还是美杜莎以前的发胶产品?第二个例子,难道你不想知道如果不涉及运动型轿车,这些死亡数字中本可以避免掉的有多少,其他不含运动型轿车的机动车恶性事故又有多少,和它们涉及的死亡数字相比上路行驶的运动型轿车到底有多少,和运动型轿车发生的死亡数字比较运动型轿车行驶的里程数有多少?谈到第三个例子,一部电影的预算和其他电影的预算之间有怎样的联系,是这部电影特别不同寻常,还是它代表了整个的电影产业?谈到美国内战的日期方面的知识,这样的调查结果和20年前类似的调查得出的结果比起来又怎么样?
当你遇到数据的时候,一定要问一句:“有什么相关的信息缺失了?”