概率抽样
抽样方式
概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。又称随机抽样,概率抽样以概率理论和随机原则为依据来抽取样本的抽样,是使总体中的每一个单位都有一个事先已知的非零概率被抽中的抽样。总体单位被抽中的概率可以通过样本设计来规定,通过某种随机化操作来实现,虽然随机样本一般不会与总体完全一致。
简介
概率抽样又称随机抽样(probability—sampling),即在抽样时,母体中每一个抽样单位被选人样本的概率相同。随机抽样具有健全的统计理论基础,可用概率理论加以解释,是一种客观而科学的抽样方法。
一般而言,概率抽样调查的基本组织形式分为单阶段抽样和多阶段抽样两大类。单阶段抽样是指只需一次的抽样过程,它有以下四种:简单随机抽样、等距抽样、分层抽样、整群抽样。多阶段抽样是指将总体分层、再逐层抽取样本的过程。多阶段抽样在总体特别大时使用。不管哪种随机抽样,样本必须始终被看作总体的近似而不是总体自身。
概率抽样是一种数理统计学上的专业化术语。它是指根据随机性理论在单位样本量中抽取同样数目的样本作为研究对象。理论上讲,每个样本被抽中的概率相等,这样就保证了抽选样本中没有掺杂所谓的人为因素。概率抽样是定量研究中的基本抽样方式,也是定量研究效度的体现方式概率抽样的具体抽样方法还有很多。简单随机
抽样法、系统抽样法以及分层抽样法等。总体而言,建立在数学概率理论基础上的概率抽样方法有着无可避免的自然科学化的倾向。在一般情况下的定性研究中。研究者较少使用这种抽样方式选取研究对象。
但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质,特征.概率抽样主要分为简单随机抽样,系统抽样,分类抽样,整群抽样,多阶段抽样等类型.现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本。
原则
概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。
原理
概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
优缺点
⑴ 概率抽样包括以下几个方面的优点:
调查者可获得被抽取的不同年龄、不同层次的人们的信息; 能估算出抽样误差; 调查结果可以用来推断总体。 例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。
⑵ 另一方面,概率抽样也有一些弊病:
-在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;
-概率抽样比非概率抽样需要更多时间策划和实施;
-必须遵守的抽样计划执行程序会大量增加收集资料的时间。
下面,我们将介绍几种友邦顾问最常采用的概率抽样技术
要求
概率抽样应满足的要求是:
随机性——总体中的所有个体都有同样被抽出的机会。
可行性——抽样的方法在实际中是可实施的。
信息性——抽得的样本尽可能反映出分析时所期望的各种信息。
方法
概率抽样包括有简单随机抽样、系统抽样(等距抽样)、分层抽样类型抽样)、整群抽样、多段抽样、PPS抽样和户内抽样。例如:
简单随机抽样
简单随机抽样是一种广为使用的概率抽样方法。是最完全的概率抽样。如前面提到的,随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。
在简单随机抽样条件下,抽样概率公式为:
抽样概率=样本单位数∕总体单位
例如,如果总体单位数为 10000 ,样本单位数为 400 ,那么抽样概率为 4 %。
简单随机抽样的优点在于,它看起来简单,并且满足概率抽样的一切必要的要求,保证每个总体单位在抽选时都有相等的被抽中的机会。简单随机抽样可以通过电话随机拨号功能完成这个步骤,可以从电脑档案中挑选调查对象。
同样,简单随机抽样会遇到“样本可能分布不均匀”以及“没有好的抽样框”等问题。
友邦顾问在简单随机抽样过程中常使用的技巧为“抽签法”和“随机表”法。
等距抽样
在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。
样本距离可通过下面公式确定:
样本距离 =总体单位数∕样本单位数
例如,假设你使用本地电话本并确定样本距离为 100 ,那么 100 个中取 1 个组成样本。这个公式保证了整个列表的完整性。
等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始,在该页上再另选一个数决定从该行开始。假定选择从第 3 行开始,这就决定了实际开始的位置。
等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。
分层抽样
定量调查中的分层抽样是一种卓越的概率抽样方式,在友邦公司以往的调查中经常被使用。
又称分类抽样或类型抽样。分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行简单随机抽样,组成一个样本。分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。可以提高总体指标估计值的精确度。
分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。
总体各单位按主要标志加以分组,分组的标志与我们关心的总体特征相关。例如,我们正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性不相同,那么性别应是划分层次的适当标志。如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费。
分层抽样与简单随机抽样相比,我们往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果我们从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
在调查实践中,为提高分层样本的精确度实际上要付出一些代价。通常,我们现实正确的分层抽样一般有三个步骤:
首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。调查表明,一般来说,识别出 6 个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。
第二,确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。利用这个比例,可计算出样本中每组(层)应调查的人数。
最后,调查者必须从每层中抽取独立简单随机样本
整群抽样
以上各种抽样类型全部是按单位抽取的,即按样本单位数,分别一个单位一个单位地抽取。在整群抽样中,样本是一组单位一组单位地抽取。
整群抽样有两个关键步骤
-同质总体被分为相互独立的完全的较小子集。
-随机抽选子集构成样本。
如果调查者在抽中的子集中观察全部单位,我们就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位观察,我们就有了二级整群样本。分层和整群抽样都要将总体分为相互独立的完全子集。它们的区别是,分层抽样的样本是从每个子集中抽取,而整群抽样则是抽取部分子集。
地理区域抽样是整群抽样的典型方式。挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域,较集中地访查一些群体,大量减少访问时间和经费。整群抽样被认为是概率抽样技术,因为它随机抽出群和随机抽出单位。值得注意的是,在整群抽样下,我们假定群中单位与总体一样存在异质性。如果一群中单位的特征非常相似,如果由于共同环境使群内差异小而群与群之间差异大。一般来说,要解决这个问题可以扩大群数,然后从各群中抽取少量单位数,以保证样本的代表性。
系统抽样
使用系统抽样(systematic sampling)时,调研人员首先选取一个随机的起点,然后连续地在抽样框架中每隔i个个体就选出一个样本。其选取样本的间隔i被称作抽样间距(sampling interval)。它是由总体大小N除以样本量聍的结果四舍五人后得出的。例如.假设总体中共有100 000个个体,样本量大小为l 000。在这一情况下,抽样间距为100,即从1至100之间随机选择一个数字。如果选取的是数字23,那么样本就包括个体23、123、223、323、423、523等。
使用系统抽样方法时,调研人员通常会按照某一方式把总体中的个体进行排列。如果电话簿被用作抽样框架,其中的个体就会被按照首字母顺序进行排列。在一些情况下,这一顺序也许会与调研人员感兴趣的某些特征有关。例如,调研人员可能会按照未偿还余额对信用卡使用者进行排列,或按照年销售额对某一行业内的公司进行排列。当调研人员按照与某些被调研的特征有关的方式对个体进行排列时,利用系统抽样获得的抽样结果会与利用SRS获得的抽样结果存在很大的不同。如果对一份按销售额递增顺序排列的公司名单进行系统抽样,那么所得到的样本就既包括大型公司也包括小型公司。相比之下,利用简单随机抽样所得到的样本就缺乏代表性。例如,使用简单随机抽样时.调研人员所得到的样本可能只包含小型公司,或者包含较少数量的小型公司。
在使用系统抽样时,如果抽样框架被设计成循环结构,那么其样本的代表性就会降低。假如使用系统抽样。从包含60年以来每个月月销量的抽样框架中可以产生出一个商场月销量的抽样。如果抽样间隔为12,那么最终的抽样则不会反映月销量的变化情况。
系统抽样要比SRS更加经济和简单,因为随机选择的过程只有一次。此外.系统抽样也不需要了解抽样框架的构成。例如,每第i个离开商场或商店的顾客都可以被拦截。由于以上原因,系统抽样经常被应用于顾客邮件、电话和商场拦截式访谈。下面的例子就很好地说明了这一点。
参考资料
最新修订时间:2023-12-29 19:22
目录
概述
简介
参考资料