统计估计(statistical estimation)是统计推断的一种形式,统计估计的方法是用样本的函数来估计总体的分布函数、分布参数或数字特征。例如,用样本均值估计总体均值;用
经验分布函数估计总体分布函数等,参数估计与
非参数估计是统计估计的两大部分。
统计估计是指推断统计中用样本资料去估计总体参数的方法。有
点估计与
区间估计两种。
数理统计包括
统计描述和
统计推断两部分,统计推断就是由样本推断总体,是统计学的核心内容,统计推断内容非常丰富,大致可以归纳为两大类:统计估计和统计检验。统计估计分为
参数估计和
非参数估计、点估计和区间估计,下面只涉及参数的点估计和区间估计,参数的点估计,指用
样本统计量的值估计未知参数的值。参数的区间估计就是用样本来确定一个区间,使这个区间以很大的概率包含所估计的未知参数,这样的区间称为置信区间。
点估计是直接估计总体参数的值,通常用样本数据的一个统计量作为总体参数的估计量。例如,在估计一个正态总体的平均数时,把样本数据的平均数取作总体平均数的估计量。点估计时,要求样本统计量是无偏统计量,即要求在无数次重复抽样时,这种样本统计量产生的分布的平均数等于被估计的参数。还要求这个样本分布的方差比其他
无偏估计量的方差要小。
若总体X的分布函数 的类型已知,其中的参数 是未知的,这时可以在总体X中抽取样本 ,根据待估参数的特征构造出适当的统计量 作为参数 的估计量;然后由抽取的样本观察值 ,计算得到估计量的观察值 ,就是未知参数 的估计值(i=1,2,…,m),这种做法称为参数的点估计,常用的点估计方法有
矩估计和
最大似然估计,对估计量优劣的评价标准有
无偏性、
有效性和
一致性(相合性)等。
矩估计法的基本思想是:用样本矩估计总体矩,用样本矩的函数去估计总体矩的相应的函数,从而达到对总体参数进行估计的目的。
总体X分布的参数 往往通过总体矩(数字特征)反映出来,因此若用样本矩来替换总体矩,用样本矩的函数替换相应的总体矩的函数,则可获得总体参数 的估计量,这种估计方法称为矩估计法。
最大似然估计又称极大似然估计,它的基本思想是在给定样本观察值 之下,给出参数 的估计值 ,使得在 之下,样本 出现的可能性最大.
用来估计未知参数 的真值的统计量 称为 的估计量,如用 作为总体期望 的估计量,用 作总体方差 的估计量等等,但也可用 估计 用 估计 等,也就是说估计量不唯一,因而存在对估计量的评价问题,评价标准主要有三条:
(2) 有效性(最小方差性) 若 和 都是 的
无偏估计量,如果 则称 比 有效。若在 的一切无偏估计中, 的方差最小,称 为 的最小方差无偏估计量;
(3)一致性(相合性) 设是的估计量,若依概率收敛于,即对任意,有则称是的一致估计量>常用估计量都满足一致性,所以我们在评价估计量时,往往只验证其无偏性与其比较有效性。
区间估计是构造 一个区间,推断参数的真值以某个概率落在这个区间内。这个概率称为“区间的置信水平”。这个区间,称为“置信区间”。例如已知一个正态分布,它的平均数为μ,方差为α2。反复抽取数据个数为n的样本直至无数次,由中心极限定理可知,这些样本的平均数x形成一个以总体平均数μ为平均数。方差为α2/n的正态分布。根据正态分布性质,对任意 一个样本的平均数x,可有 的概率。 这个关系完全等价于 的概率。 总体平均数是未知的,x的值可以从我们抽取的某个样本中求出,则从上式推断总体平均数μ将在0.95的概率水平上落在区间 内, 这就是总体平均数的置信区间。在这区间的上下限中,总体的方差α2一般也是未知的,我们仍要用样本资料对它进行点估计,并在实际构造置信区间时,不一定用正态分布而用t分布等其他分布,使得推断更为可靠。