这是美国总统选举史上一个真实的案例。这则案例告诉我们,由于一些隐含因素的影响,统计的实际结果和人们的预测是大相径庭的。

1936年,美国罗斯福总统准备竞选连任,他的对手是堪萨斯州州长兰顿,大多数的观察家都认为罗斯福可轻易实现连任。因为罗斯福和兰顿当时的竞争背景是,美国正从经济大萧条中复苏,尽管全国仍有900万失业人口,人民的实际收入比1929-1933年那段时期少了约1/3,但总体情况正处于慢慢好转的态势。

这无疑为罗斯福在任期间财务赤字的辩护提供了有利支撑,有谁不愿意这种良好的趋势延续下去呢?所以刚刚成立的盖洛普咨询公司在调查了50000个样本后, 便预测罗斯福会得到 56% 的选票获胜。

打开网易新闻 查看更多图片

乔治.盖洛普,盖洛普公司的创始人

图源:google.com

但这个预测并没有引起足够重视,因为在当时盖洛普的名头比起《文学文摘》 (Literary Digest) 杂志显然要逊色的多。要知道,《文学文摘》在总统选举的预测中素负声望, 自1916年开始做预测以来未曾有一次失手,所以它的预测结果才是人们特别关注的。

在大众的期待中,《文学文摘》杂志给出了预测结果:兰顿会以 57% 比43% 大胜罗斯福。这可不是随意的判断,杂志依据的是从庞大读者群中回收的高达约240万份调查问卷的统计数据,这几乎可称之为有史以来范围最大的一次民意调查,无论如何都具有巨大和充分的说服力,有不同意见的少数观察家也不得不保持沉默静待结果。

1936年,预测兰顿获胜的《文学文摘》封面

图源:mathcenter.oxford.emory.edu

可令大多数人意外的是,选举结果却是罗斯福以 62.5% 比37.5% 获得压倒性的胜利,正好与《文学文摘》的预测南辕北辙,而栽了大跟斗的《文学文摘》在总统选举完不久就宣告破产。人们不禁好奇,此前从未失手的杂志此次何以会犯如此离谱的错误?最后,统计学家为人们揭开了谜底——调查样本偏差。

在科学严谨的抽样调查中,样本的挑选必须很公正,即必须涉及所有的可能范围,才能获得准确有效的资讯。若在选样过程中发生“选择偏差”,即有排除 (或多取) 某一类样本的倾向,那么依此进行的统计判断也极大可能发生偏差。《文学文摘》寄出的1千万份问卷,去向是订阅用户、电话簿及一些俱乐部的会员,显然这是特定和特殊的人群。1936年电话尚未普及 (平均每四户才有一台),此外,参加任何俱乐部者都要具备一定经济实力。

换句话说,这样的抽样过程存在排除穷人的倾向。在1936年以前, 这种选择偏差对于预测结果没有过多的影响, 因为当时富人与穷人的投票行为差异并不太大。但在1936年,因经济的因素,造成选民政治倾向有很大的分歧:穷人较多选择罗斯福, 而富人则倾向支持兰顿。这就造成了《文学文摘》的选择偏差。不难看出,当有选择偏差时, 样本数虽多但不见得有效。

除了这个主要原因,《文学文摘》还犯了另一个严重的错误:对于受访名单缺乏全面尽心的反馈争取。简单地说,就是调查样本中有过多没有回复或作废,也在一定程度上曲解了调查结果,这就是“拒绝(作废)偏差”。

《文学文摘》对全国所发出的1千万份问卷中,只有24%的回复。这24% 反馈者的意见,并不能代表全部被挑选选民的意愿。因为在没有反馈回收的问卷中,许多人的本意与反馈者的意见可能有很大的差异。比如,《文学文摘》在芝加哥所发出的问卷数,大约是芝加哥选民的1/3, 不可谓不多,但其中回复者仅有20%。

在回收问卷中,支持兰顿的超过半数,但选举结果,罗斯福获得芝加哥约2/3的选票。可以看出,《文学文摘》的问卷调查既存在选择偏差,又存在拒绝偏差,导致调查预测结果错误完全在情理之中。

就一般而言,低收入与高收入者中作废(不回答)问卷的比例较高,这就导致在回收问卷里中收入者的比例远远超过事实比率。而中收入者的意见与高收入或低收入者不见得相同,所以这种中收入者占大多数的调查就存在明显的缺陷,因此现代重大议题的民意调查,在条件允许的前提下,侧重于成功率可达 65%的面访,这比回收率常不到 25%的邮寄问卷更全面也更有效。

不过即使采用面访,类似的偏差问题仍然存在,这就要求调查者对被调查者的工作类别、家庭状况、社会背景等进行详细了解,尽可能采用巧妙合理的方法,解决偏差问题以提高调查的有效性和科学性。

本文仅代表作者观点

欢迎个人转发

媒体转载授权请联系

kpsbsh2017@163.com

征稿启事

中国科学探索中心微信公众号欢迎赐稿!

稿件内容以反伪破迷为核心思想,科学普及、科学文化、科技哲学、科学与公众、世俗人文主义、科技伦理等领域均可涉及,旨在将科学探索结果无偏见地告知公众,避免公众上当受骗。

稿件一经采用,将奉上稿酬。

投稿邮箱:

kpsbsh2017@163.com

中国科学探索中心

崇尚科学 反伪破迷

爱我请给我“在看”