U统计量
重要的统计量
U统计量(U-statistic)是一种重要的统计量,是霍夫丁(W.Hoeffding)于1948年引进的一种非参数统计量,是样本均值的推广。统计量(statistic)是指样本的已知函数,其作用是把样本中有关总体的信息汇集起来,是数理统计学中一个重要的基本概念。常用统计量有样本矩次序统计量、U统计量和秩统计量等。
基本介绍
估计问题有的是对特殊分布族的某个参数函数的估计,例如Bernoulli分布的概率p的估计问题,也有一些是对广泛的分布族中分布F的某个特征的估计问题,例如分布F的均值、方差或分布函数在某一点的函数值的估计问题。对于分布的特征均值 或分布函数在的函数值也可写成如下的形式:
在上述的表示中,如果将分布本身看作为一个“参数”,那么要估计的分布的特征也是“参数”的函数。所以一般的可以考虑下列形式的特征的估计问题:
这里的分布族可以是较为广泛的分布族,例如。
式(1)中的h也称为参数函数g的核(kernel),k称为核的阶(order)。
对于以为核的参数函数, 一个基于样本的简单的无偏估计是,但它只使用了样本的前几个观测,为了利用所有的观测,一个自然的做法是对称化。
定义 基于样本的统计量
称为U-统计量(U statistics),h也称为统计量的核。(2)中的表示对中取k个元素的排列求和。
相关性质
(1)以h为核的U-统计量是h对应的参数函数的无偏估计。
(2)由于对的任一个排列成立
所以不妨只考虑关于其变量为对称的核h,即h满足条件
对的任一个排列成立。
(3)对于对称的k阶核h,其U-统计量可写为
(4)U-统计量关于的任一排列是不变的,所以它是只依赖于样本顺序统计量的函数。
统计量
统计量(statistic)是指样本的已知函数,其作用是把样本中有关总体的信息汇集起来,是数理统计学中一个重要的基本概念。常用统计量有样本矩次序统计量、U统计量和秩统计量等。其中U统计量是W.霍夫丁于1948年引进的。统计量的充分性和完全性是两个重要概念,充分性是费希尔在1925年引进的,内曼和P.R.哈尔莫斯在1949年严格证明了一个判定统计量充分性的方法,叫做因子分解定理。统计量的分布叫做抽样分布,它的研究是数理统计中的重要课题。对一维正态总体,有三个重要的抽样分布,即分布、分布和分布。其中分布是F.赫尔梅特于1875年在研究正态总体的样本方差时得到的;分布是英国统计学家W.S.戈塞特(笔名“学生”)于1908年提出的;分布是费希尔在20世纪20年代提出的。
参考资料
最新修订时间:2022-08-25 15:13
目录
概述
基本介绍
参考资料