抽样偏差是统计学的
概念,统计学中随机抽样的基本原则就是随机。而抽样偏差就是在抽样过程由于一系列因素造成不符合
随机抽样的原则,导致样本失去可以估计总体的能力(失真)。
抽样又称
取样。从欲
研究的全部
样品中抽取一部分样品单位。其基本要求是要保证所抽取的
样品单位对全部样品具有充分的代表性。
抽样的
目的是从被抽取
样品单位的
分析、
研究结果来
估计和
推断全部样品
特性,是
科学实验、
质量检验、
社会调查普遍采用的一种
经济有效的
工作和研究
方法。抽样设计在进行过程中要遵循四项原则,分别是:1、目的性;2、可测性;3、可行性;4、经济型原则。
此时,美国失业人数高达九百万,在1929--1935这段期间实际收入下降了约1/3,经济正由大萧条中逐渐恢复回升。兰登竞选主题为“小政府”口号为“挥霍浪费的人必须离任”“我们应该专心致力于自己的事务”罗斯福竞选主题为“扩大内需”口号为“在我们能够平衡联邦政府的预算之前,必须先平衡美国人民的预算”。绝大多数观察家认为罗斯福将毫不费力的获胜,而《文学文摘》(literary Digest)杂志根据大约240万人参加的一次民意测验预测,兰登会以57%对43%的优势获胜。《文学文摘》的显赫威望支持着它的预测,因为自1916年起,在历届总统选举中该杂志都能正确地预测出获胜的一方。实际的竞选结果是罗斯福以62%对38%的一边倒优势赢得了1936年的选举,连任总统。
1、取样方法:邮寄1千万份问卷,回收420万份,但调查对象是从电话簿、汽车车主的登记资料以及选举人的登记名单中选取。在经济大萧条时期,电话和汽车并不像现在这样普遍,当时仅有1100 万人拥有住宅电话,但900万人失业,仅针对拥有汽车和电话的少数人进行调查并不具有代表性,但是这些名单比较容易得到。
2、抽样偏差:取样中包含过多的富人,而该年贫富间选举倾向相距极大。那些富人支持共和党的候选人,那些未能被调查的低收入民众却大部分支持民主的罗斯福,导致调查结果失真。取样有偏差时,再多的样本也没有用。
3、有回答或拒回答( non-response),或低回复率( response rate) 引起偏差。邮寄发出的调查问卷大约有1000万张,但只有少数的调查表被收回,有效回复率仅为23%。在收回的调查表中,兰登非常受欢迎。于是,该杂志预测兰登将赢得选举。以芝加哥为例,问卷寄给1/3 的登记选民,回收的20%的问卷,其中超过一半宣称将选兰登,但选举结果却是罗斯福拿到2/3的选票。对此,有的研究者认为回复此项调查的样本对象大都心存偏见。