推断统计是研究如何利用样本数据来推断总体特征的统计方法。比如,要了解一个地区的人口特征,不可能对每个人的特征一一进行测量,对产品的质量进行检验,往往是破坏性的,也不可能对每个产品进行测量。这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。
基础定义
推断统计就是用
概率数字来决定某两组(或若干组)数字之间存在某种关系的可能性,并由
样本特征来推断总体特征的统计方法。
教育科学研究一般不可能对所要研究的对象的全体逐一进行考察,而是从总体中抽取一定的样本进行研究。例如,要了解一个地区的人口特征,不可能对每个人的特征进行测量。
在研究设计中又常将被试按一定要求分为不同组,以便于研究的进行和统计处理,这样就产生了由样本估计和推测总体等问题。
例如,要了解一个地区的人口特征,不可能对每个人的特征一一进行测量,对成品质量进行检验,往往是破坏性的,也不可能对每个产品进行检验。这就需要抽取样本个体进行测量,根据获得的数据对总体特征进行推断,这就是推断统计既要解决的问题。推断统计学非常有用,因为它允许我们给予有限的信息(样本)对总体得出结论。
步骤
主要内容
推断统计包括两方面的内容:总体参数估计和假设检验。
总体参数估计
当研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。总体参数估计可分为点估计和区间估计。
点估计是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示。由于这种估计是单个的数值,总是存在误差,对误差也不能准确地计算出来。另外,点估计无法指出对总体参数给予正确估计的概率有多大。所以,这种点估计只能作为一种不精确的大致的估计,更好的办法是对总体参数进行区间估计。
区间估计是根据样本统计量,利用抽样分布的原理,用概率表示总体参数可能落在某数值区间之内的推算方法。区间估计的种类有很多,主要有总体平均值的区间估计,总体百分数的区间估计,标准差和方差的区间估计,相关系数的区间估计。
假设检验
在统计学中,通过
样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称做假设检验。假设检验分为参数检验和
非参数检验。
若进行
假设检验时总体的分布形式已知,需要对总体的位置参数进行假设检验,称其为
参数假设检验。若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称之为非参数假设检验。
比较分析
统计学中的描述派和推断派在本世纪二十至四十年代的对峙辩论,基本上可以说是以统计推断思想的迅速发展而告终结的。但到了六十年代,随着
贝叶斯统计思想的勃兴,人们又回过头来从更为客观的角度上去认识整个统计学和其中的各种不同思想,并力图寻找到各种统计思想所赖以存在其根本意义一致的统计认识对象和认识方法,这就是我们所说的总体规律和概率论。这两点已成为西方各种统计思想流派所共同坚持的最本质的东西,是整个统计学的两个内核。但是,这种“泛性”统计学的观点仍然是建立在各种统计思想流派具有显著差别的基础之上的。就描述统计和推断统计而言,这种差别主要体现在以下三个方面:
首先,思想认识不同。
描述统计认为只有通过大量观察(而非几个实验)才能全面和正确地反映出现象变化的规律性,而如果将这种观察仅仅局限于若干个少量的、局部的实验上,得出的结论必然是片面的,甚至是错误的。从哲学上看,它坚持可知论,反对人类智力有限论,认为人类完全有能力去进行大量的乃至全面的观察。与此相反,推断统计却极力反对那种泛泛地、全面地去搜罗大量的、庞杂的原始数据,认为与其这样,还不如将注意力集中在精确设计和控制之下的实验中,这样得到的资料才真正称得上翔实可靠,由此也才能更加准确地反映现象变化的规律性。
其次,采取的方式不同。这一点也正是思想认识不同所必然引申出来的差异。描述统计坚持大量观察,而推断统计则坚持样本分析,并且其实质是小样本分析。于是,大致可以这样说:描述统计的规律是在总体信息(全面数据)中“直接”显示出来的,是被描述(简缩)出来的;而推断统计的规律则是透过样本信息(局部数据)“间接”显现出来的,是被推断(估计或检验)出来的。
最后,
逻辑结构不同。推断统计由于主张用样本去进行推断,因此,它必须首先构造出两个最基本的统计范畴,即总体和样本,而其他的统计范畴或概念则相对成为它们的次第的派生范畴或概念,可称之为子范畴或子概念。与此不同,对描述统计来说,这对基本范畴(尤其是后者)并非不可缺少的。若想借助于这对基本范畴来建立整个统计学的范畴或概念体系,则粗略地可以讲,描述统计属于大样本分析,而推断统计则属于小样本分析。
教学应用
选取与学生生活最为贴近的案例,通过实践教学的设计让学生全程参与总体数据的获取、随机样本的抽取、常用统计量的计算、对
总体参数的推断与检验等环节,循序渐进地对
抽样分布、
参数估计、
假设检验等统计推断理论中的一些关键问题和概念获得直观的认识.该方法可以将抽象的统计理论形象化,有利于加深学生对统计推断理论思想的理解。