正文

9.是真规律,还是伪科学?(9)

数字是靠不住的 作者:(美)查尔斯·塞费


当《华尔街日报》的编辑们将税率和对应的税收数字标记出来时,他们在数据中清晰地看到了一条拉弗曲线。

很明显,《华尔街日报》的编辑们依据数据画出了一条稀奇古怪的曲线,难道这就是里根经济政策所预示的吗?从这个特定的数据组合中画出那样一条升降幅度明显的拉弗曲线,却没有任何值得信服的理由。直接从左到右划一条直线或许更适合这些数据。但是,通过利用一个局外国家——挪威——的数据来捏造这条曲线的方式,编辑们耍弄着“关联诡辩”的花招儿,让阿瑟·拉弗显得神机妙算,尽管这些数据本来会让他露怯出丑。

胡乱回归分析:谁会是下一届美国总统?

即使当数据似乎与画线相吻合时,当能够“归纳”出数据特征的规律呼之欲出时,“数字的骗术”的风险也无处不在。因为就算统计学家、经济学家或科学家能够发现数据组合之间存在的真实关系,也不能确保这种关系有任何实际意义。数据图中的某条线、某个方程式、某个公式也许能描绘出存在于这大量数据中的紧密联系,然而这一切也许没有任何实用价值。

发布于2004年《自然》杂志上的一份由动物学家、地理学家和公共卫生专家们联合署名的研究报告就是一个极具代表性的范例。这群知名的科学家分析了田径运动员们在历届奥运会100米短跑项目中的比赛成绩,而且找到了一些显著的“规律”。男短跑运动员们越跑越快,他们花在100米短跑项目上的时间不断变短,以至于你可以画出一条下降趋势明显的直线(这也正是科学家们所干的事情)。同样,女短跑运动员们也越跑越快,她们的成绩也可以用近似的线条很好地描绘出来。

下图似乎可以完美地解释这些成绩的数据。它们绝不偏离画出的直线,因此科学家们表现出了充足的信心,坚信这两条线可以描绘出男女运动员们在100米短跑项目中的成绩提高趋势,并认为这种趋势甚至会延续到遥远的未来。而且,如果延伸这两条线,你会发现它们将相交——女运动员们的成绩赶上然后超过男运动员们的成绩——于2156年。最终结论是,女短跑运动员将在下世纪中叶跑得比男短跑运动员还快。(为了给自己的观点留下足够的余地,科学家们进行了复杂的计算机模拟操作,并指出女短跑运动员开始跑得比男短跑运动员快的那个“纪念日”将出现在2064~2788年。)毕竟,画出的这两条线看起来与实际数据相吻合,而且它们相交就代表了女短跑运动员的成绩超过男短跑运动员。

然而,这样画线实际上是荒谬的。继续将线延长下去,其荒谬本质就显而易见了。根据目前这两条线的走势,女短跑运动员在2224年左右就能在7秒之内跑完100米——其速度几乎达到了每小时32英里。他们耍弄花言巧语的手段,或许能把这说成是可能的。但这两条线还可以延伸。如果你一直延长它们,就可以发现再过150年女短跑运动员速度能达到每小时60英里。等到2600年,女短跑运动员的短跑速度居然会超过音速。之后不久,她们的速度甚至会赶超光速。如果当真如此,那么时光或许会倒流,她们会在比赛开始前就赢得比赛。所以,这两条线绝对不可能如实展示出未来的数据走势,它们不过是对真实事物的错误阐述而已。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号