对于给定的统计推断问题,包含了原样本中关于该问题的全部有用信息的统计量。对于未知参数的估计问题,保留了原始样本中关于未知参数θ的全部信息的统计量,就是充分统计量。如样本均值X是总体
数学期望的充分统计量。数学上,设(X1, …,Xe)是来自总体X的一个随机
样本,T=T(X1, …,Xe)是一统计量。若在T=t的条件下,样本的条件分布与未知参数θ无关,则称统计量T是θ的充分统计量。
样本中包含关于总体的信息可分为两部分:其一是关于总体结构的信息,即反映总体分布的结构;其二是关于总体中未知参数的信息,这是由于样本的分布中包含了总体分布中的未知信息。我们对信息的加工只会减少,不会增多,即统计量具有压缩数据功能,但会凸显我们需要的信息。那么一个好的统计量应该能将样本中包含未知参数的全部信息提取出来,即样本加工不损失未知参数的信息称为充分性。如何将这一想法用数学形式表示呢?费希尔在1922年提出了一个重要概念——充分统计量计量。粗略地说,充分统计量就是不损失信息的统计量,在简化统计问题中是非常重要的概念,也是经典统计和
贝叶斯统计中为数不多的相一致的观点之一。
一个统计量 是参数 的充分统计量,其
充分必要条件是存在一个t与 的函数和一个样本的函数 ,使得对于任何一个样本x和任意的 ,样本的联合密度函数 可以表示为它们的乘积,即
设 是来自正态分布 的样本,由于 是 的充分统计量,若 的先验分布取
正态分布 ,其中 为已知,那么 的后验分布可用充分统计量 的分布算得,即