抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行
调查,并据此对全部调查研究对象做出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。根据抽选
样本的方法,抽样调查可以分为概率抽样和
非概率抽样两类。概率抽样是按照
概率论和数理统计的原理从调查研究的总体中,根据
随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。
抽样调查简述
抽样调查是一种
非全面调查,抽样调查是根据随机的原则从总体中抽取部分实际数据进行调查,并运用概率估计方法,根据样本数据推算总体相应的数量指标的一种统计分析方法。抽样调查虽然是非全面调查,但它的目的却在于取得反映
总体情况的信息资料,因而,也可起到
全面调查的作用。
根据抽选样本的方法,抽样调查可以分为
概率抽样和
非概率抽样两类。概率抽样是按照
概率论和
数理统计的原理从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。在我国,习惯上将概率抽样称为抽样调查。
特点
抽样调查从研究对象的总体中抽取一部分个体作为
样本进行调查,据此推断有关总体的数字特征,经济性好,时效性强,适应面广,准确性高。
抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称登记误差或调查误差),一种是
代表性误差(也称抽样误差)。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。
抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是:
(1)调查样本是按
随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。
(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。
(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。
基于以上特点,抽样调查被公认为是
非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。
步骤
抽样调查的一般步骤如下:
(1)界定总体
(3)实施抽样调查并推测总体
(4)分割总体
(5)决定样本规模
(6)决定抽样方式
(7)确定调查的信度和效度
适用范围
第一、不能进行全面调查的事物。有些事物在测量或试验时有破坏性,不可能进行全面调查。如,电视的抗震能力试验,灯泡的耐用时间试验等。
第二、有些总体从理论上讲可以进行全面调查,但实际上不能进行全面调查的事物。如,了解某个森林有多少棵树,职工家庭生活状况如何等。
第三、抽样调查方法可以用于工业生产过程中的质量控制。
第四、利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。
分类
概率抽样
这是一种最简单的一步抽样法,它是从总体中选择出抽样单位,从总体中抽取的每个可能样本均有同等被抽中的
概率。抽样时,处于
抽样总体中的抽样单位被编排成 1~n编码,然后利用
随机数码表或专用的计算机程序确定处于1~n间的随机数码,那些在总体中与随机数码吻合的单位便成为随机抽样的样本。
这种
抽样方法简单,误差分析较容易,但是需要
样本容量较多,适用于各个体之间差异较小的情况。
这种方法又称顺序抽样法,是从随机点开始在总体中按照一定的间隔(即“每隔第几”的方式)抽取样本。此法的优点是抽样
样本分布比较好,有好的理论,总体估计值容易计算。
它是根据某些特定的特征,将总体分为同质、不相互重叠的若干层,再从各层中独立抽取样本,是一种不等
概率抽样。分层抽样利用
辅助信息分层,各层内应该同质,各层间差异尽可能大。这样的
分层抽样能够提高样本的代表性、总体
估计值的精度和
抽样方案的效率,抽样的操作、管理比较方便。但是抽样框较复杂,费用较高,误差分析也较为复杂。此法适用于母体复杂、个体之间差异较大、数量较多的情况。
4.随机抽样——整群抽样法
整群抽样是先将总体单元分群,可以按照自然分群或按照需要分群,在交通调查中可以按照地理特征进行分群,随机选择群体作为抽样样本,调查样本群中的所有单元。整群抽样样本比较集中,可以降低调查费用。例如,在进行居民出行调查中,可以采用这种方法,以住宅区的不同将住户分群,然后随机选择群体为抽取的样本。此法优点是组织简单,缺点是样本代表性差。
5.随机抽样——多阶段抽样法
多阶段抽样是采取两个或多个连续阶段抽取样本的一种不等概率抽样。对阶段抽样的单元是分级的,每个阶段的
抽样单元在结构上也不同,多阶段抽样的样本分布集中,能够节省时间和经费。调查的组织复杂,总体估计值的计算复杂。
6.随机抽样——等距抽样
等距抽样也称为系统抽样、或机械抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。
根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
等距抽样的最主要优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。
7.随机抽样——双重抽样
双重抽样,又称二重抽样、复式抽样,是指在抽样时分两次抽取样本的一种抽样方式,其具体为:首先抽取一个初步样本,并搜取一些简单项目以获得有关总体的信息;然后,在此基础上再进行深入抽样。在实际运用中,双重抽样可以推广为多重抽样。
8.随机抽样——按规模大小成比例的概率抽样
按规模大小成比例的概率抽样,简称为
PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。
9.随机抽样——任意抽样
随意抽取调查单位进行调查(与随机抽样不同,不保证每个单位相等的入选机会)如:柜台访客调查,街头路边拦人调查。
10.非随机抽样——重点抽样
只对总体中为数不多但影响颇大(标志值在总体中所占比重颇大)的
重点单位调查。
11.非随机抽样——典型抽样
挑选若干有代表性的单位进行研究。
12.非随机抽样——配额抽样
对总体作若干分类和样本容量既定情况下,按照配额从总体各部分进行抽取调查单位。
非概率抽样
非概率抽样就是调查者根据自己的方便或主观判断抽取样本的方法。
它不是严格按
随机抽样原则来抽取样本,所以失去了
大数定律的存在基础,也就无法确定
抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。
常用的名词
在抽样调查中,常用的名词主要有:
1、总体
总体是指所要研究对象的全体。它是根据一定研究目的而规定的所要调查对象的全体所组成的集合,组成总体的各研究对象称之为
总体单位。
2、个体
个体是指总体中的每一个考察对象。
3、样本
样本是总体的一部分,它是由从总体中按一定程序抽选出来的那部分总体单位所组成的集合。
4、样本的容量
样本中个体的数量叫做样本的容量。
抽样框是指用以代表总体,并从中抽选样本的一个框架,其具体表现形式主要有包括总体全部单位的名册、地图等。
抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的影响。
6、抽样比
抽样比是指在抽选样本时,所抽取的样本单位数与
总体单位数之比。
对于抽样调查来说,样本的代表性如何,抽样调查最终推算的
估计值真实性如何,首先取决于抽样框的质量。
置信度也称为可靠度,或
置信水平、置信系数,即在抽样对
总体参数作出估计时,由于样本的
随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是
数理统计中的
区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。
在抽样调查中,通常以样本作出估计值对总体的某个特征进行估计,当二者不一致时,就会产生误差。因为由样本作出的估计值是随着抽选的样本不同而变化,即使观察完全正确,它和总体指标之间也往往存在差异,这种差异纯粹是抽样引起的,故称之为抽样误差。
9、偏差
所谓偏差,也称为偏误,通常是指在抽样调查中除抽样误差以外,由于各种原因而引起的一些偏差。
10、均方差
在抽样调查估计总体的某个指标时,需要采用一定的抽样方式和选择合适的
估计量,当抽样方式与估计量确定后,所有可能样本的估计值与总体指标之间
离差平方的
均值即为均方差。