正文

8.是真规律,还是伪科学?(8)

数字是靠不住的 作者:(美)查尔斯·塞费


事实上,这份研究报告的作者们只不过是得到了一大堆随机数据,然后从这些随机事件中生硬地构建出所谓的规律而已。穿红色比赛服的运动员比穿蓝色比赛服的运动员赢得了更多场次的比赛,这不过是碰巧而已,而这些人类学家却专门写了份研究报告,把巧合阐述成必然。(如果他们发现穿蓝色比赛服的胜利者比穿红色比赛服的胜利者多,他们也可以利用另一种鸟——北美洲紫燕来说事,在那种鸟群里,羽毛带蓝色是占据种群“领导”地位的标志。)尽管如此,这些人得到的“研究结果”很明显就是“关联诡辩”的产物。如果这些人类学家花一些时间去检验其他几届奥运会的情况,毫无疑问他们会发现这貌似有理的伪规律失效了。事实就是如此,2008年奥运会的赛况就足以表明穿红色比赛服并没有任何优势可言;如果我们仔细检查与所谓的规律有关的那几个项目,你会发现穿红色比赛服的运动员甚至略微处于劣势。穿蓝色比赛服的运动员比穿红色比赛服的运动员赢得了更多场次的比赛,这种情况在自由式摔跤项目中尤其明显,我们完全可以归纳出大量数据来证明穿红色比赛服的“优势”在无形中消失了。每个失效的预测都可以充分证明某种规律纯粹是骗人的。每种规律都允许大家借此引申出预测。如果你真的相信穿红色比赛服比穿蓝色比赛服更占优势,你就可以预测通常情况下更常穿红色比赛服的运动员会赢得赛事,你甚至能够利用这个预测去赌博。可是,虚假的规律不具备预测力,它似乎能提供充足的依据来帮助人们理解过去的数据,但用它来验证新数据必然会失效。在本书中你将多次看到这类事例。对,这本身就是一种规律。

如果你从大量数据中随机收集了一部分,然后仔细研究它们,你就会发现某种形式的规律。如果你足够聪明,那么你会把规律介绍给其他人,让他们也来检验它。例如,你可以随机收集一些数据然后作出标记,你得到的图形可能看起来像炸弹爆炸现场那样一片混乱,根本找不到任何顺序。尽管如此,如果你在整片混乱的数据上划上一个圈,那么你就能够诱导别人和你一起去理解根本不存在的规律。如果你做得足够令人信服,你甚至能把这根本不存在的规律写下来并发表到学术类专业杂志上。上图就曾出现在《自然》杂志上,并被用来证明腰围大的女人更容易生男孩。这种说法原本不过是笑料而已,但这样一来人们似乎当真了。

在很多数据中画线是一种非常有用的方法,它可以用来辅助人们解释这些数据。线就代表着次序,它意味着有人已经从图中这些天然、随意、混乱的点中找出了规律。即使我们的眼睛暂时不能直接看到这些规律,线也给予了我们可以看到规律的信心,即使规律根本就不存在时也是如此。

例如,《华尔街时报》曾经在2007年刊载了一篇社论,该文章猛烈抨击美国政府征收过高的企业经营税的行为,但自相矛盾的是,该文章居然宣称降低税率会让税收总额提升。这种说法是违反直觉的。如果政府希望从公民中征收更多税,那么它肯定会提高税率,而不会降低税率。尽管如此,这种“降低税率会带来更多税收”的断言却是里根政府经济政策的核心(这曾被小布什称为“巫术经济学”),而且已经被很多保守派人士接受了。这种想法可以用图形直观地描绘出来,其图形就是以经济学家阿瑟·拉弗的名字命名的“拉弗曲线”。其含义是,当政府提高税率时,税收总额会随之增加,并达到最大值,然后迅速下降直到0。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号