抽样推断(Sample Inference)是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。统计分析的主要任务,就是要反映现象总体的数量特征。但在实际工作中,不可能、也没有必要每次都对总体的所有单位进行全面调查。在很多情况下,只需抽取总体的一部分单位作为样本,通过分析样本的实际资料,来估计和推断总体的数量特征,以达到对现象总体的认识。
全及总体是研究对象,而样本总体则是观察对象,两者是有区别而又有联系的不同范畴。全及总体又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。
样本总体的单位数称为
样本容量,通常用小写英文字母 n来表示。随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,
样本平均数愈接近总体平均数。
总体参数又称为全及指标,根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的
综合指标。常用的全及指标有总体平均数(或总体成数)、
总体标准差(或总体方差 )。
样本统计量又称样本指标,由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标(抽样指标)。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差 )。
样本容量是指一个样本所包含的单位数。通常将样本单位数不少于30个的样本称为大样本,不及30个的称为小样本。社会经济统计的抽样调查多属于大样本调查。
样本个数又称样本可能数目。指从一个总体中可能抽取的样本个数。一个总体有多少样本,则样本统计量就有多少种取值,从而形成该统计量的分布,此分布是抽样推断的基础。
重复抽样是从总体单位中抽取一个单位进行观察、纪录后,再放回总体中,然后再抽取下一个单位,这样连续抽取样本的方法。
不重复抽样是从总体单位中抽取一个单位进行观察、纪录后,不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取样本的方法。
强调
随机原则是形成抽样推断机制的一条主线:遵循随机原则是抽样调查的基本特征之一,正是因为按照随机原则进行抽样,从一个总体当中可以抽取到不同样本,抽样指标是样本变量的函数,才会使得抽样指标是随机变量;也正是因为抽样指标是随机变量,不同的样本其抽样指标的数值不同,才会形成抽样指标的数值在不同的样本之间的分布,即抽样指标的概率分布;又是因为不同的样本其抽样指标数值不同,才会形成反映抽样指标的各个取值与其均值(全及指标)之间的平均离差程度的指标即
抽样平均误差。
强调区分
样本指标的标准差和样本标准差两个不同的概念:样本指标的标准差即抽样指标的标准差。以抽样平均数为例,抽样平均数的平均误差反映抽样平均数的各个取值对全及平均数的平均离散程度,由于全及平均数等于抽样平均数的期望值,因此,抽样平均数的标准差就等于
抽样平均误差。样本标准差是指对于一个已选取好的样本,样本中各个单位的标志值与其平均数的标准差。