序贯分析
数理统计学术语
序贯分析是数理统计学的一个分支。其名称源出于美国统计学家亚伯拉罕·瓦尔德在1947年发表的一本同名著作。在研究决策问题时,不是预先固定样本量(观察数目),而是逐次取样(观察),直到样本提供足够的信息,能恰当地作出决策为止。这样的统计决策过程称为序贯分析。
简介
在研究决策问题时,不是预先固定样本量(观察数目),而是逐次取样(观察),直到样本提供足够的信息,能恰当地作出决策为止。这样的统计决策过程称为序贯分析。
在序贯分析中,样本量是随机变量。
步骤
序贯分析一般包含如下步骤:
(1)首先决定是否需要取样(观察)。若无需取样,做出一个决策,否则进入(2);
(2)继续取样(观察);
(3)根据已有样本(观察),决定是停止取样还是继续取样。若决定停止取样,作出一个决策,否则转入(2),循环往复直到作出决策为止。
由来
序贯分析,数理统计学的一个分支,其名称源出于A.瓦尔德在1947年发表的一本同名著作,它研究的对象是所谓“序贯抽样方案”,及如何用这种抽样方案得到的样本去作统计推断。
序贯抽样方案是指在抽样时,不事先规定总的抽样个数(观测或实验次数),而是先抽少量样本,根据其结果,再决定停止抽样或继续抽样、抽多少,这样下去,直至决定停止抽样为止。反之,事先确定抽样个数的那种抽样方案,称为固定抽样方案。
它研究的对象是所谓“序贯抽样方案”,及如何用这种抽样方案得到的样本去作统计推断。美国统计学家道奇和罗米格的二次抽样方案是较早的一个序贯抽样方案。
1945年,施坦针对方差未知时估计和检验正态分布的均值的问题,也提出了一个二次抽样方案,据此序贯抽样方案既可节省抽样量,又可达到预定的推断可靠程度及精确程度。第二次世界大战时,为军需验收工作的需要,瓦尔德发展了一种一般性的序贯检验方法,叫做序贯概率比检验,此法在他的1947年的著作中有系统的介绍。瓦尔德的这种方法提供了根据各次观测得到的样本值接受原假设H0或接受备择假设H1的临界值的近似公式,也给出了这种检验法的平均抽样次数和功效函数,并在1948年与美国统计学家沃尔福威兹一起,证明了在一切两种错误概率分别不超过α和β的检验类中,上述序贯概率比检验所需平均抽样次数最少。瓦尔德在其著作中也考虑了复合检验的问题,有许多统计学者研究了这种检验。瓦尔德的上述开创性工作引起了许多统计学者对序贯方法的注意,并继续进行工作,从而使序贯分析形成为数理统计学的一个分支。除了检验问题以外,序贯方法在其他方面也有不少应用,如在一般的统计决策、点估计、区间估计等方面都有不少工作。
序贯概率比检验
简介
第二次世界大战时,为军需验收工作的需要,瓦尔德发展了一种一般性的序贯检验方法,叫序贯概率比检验(简称SPRT)。此法在他1947年的著作中有系统介绍,其要点如下:设在原假设H0和备择假设H1之下,随机变量x的概率密度函数或概率函数随机变量都已知,且分别为p0(x)及p1(x),对x逐次观测,第i次观测的结果记为xi,称比值为样本x1,x2,…,xn的概率比。在固定抽样方案之下,事先给定自然数n,对x进行n次观测得x1,x2,…,xn,计算。
定出一常数C(其值取决于检验水平α),当λn≤C时,接受原假设H0,否则拒绝。这样在λn的值与C很接近时,H0是否被接受的界限过于断然,不大合理。瓦尔德将此修改为:指定两个数A、B,A
瓦尔德提供的近似公式是A=β/(1-α),B=(1-β)/α。他也给出了这种检验法的平均抽样次数和功效函数(见假设检验),并在1948年与美国统计学家J.沃尔弗维茨一起,证明了在一切两种错误概率分别不超过α和β的检验类中,上述序贯概率比检验所需平均抽样次数最少。
瓦尔德在其著作中也考虑了复合检验的问题,有许多统计学者研究了这种检验。瓦尔德的上述开创性工作,引起了许多统计学者对序贯方法的注意,并继续进行工作,从而使序贯分析形成为数理统计学的一个分支。
举例
一个产品抽样检验方案规定按批抽样品20件,若其中不合格品件数不超过 3,则接收该批,否则拒收。在此,抽样个数20是预定的,是固定抽样。若方案规定为:第一批抽出3个,若全为不合格品,拒收该批,若其中不合格品件数为x1<3,则第二批再抽3-x1个,若全为不合格品,则拒收该批,若其中不合格品数为x2<3-x1,则第三批再抽3-x1-x2个,这样下去,直到抽满20件或抽得3个不合格品为止。这是一个序贯抽样方案,其效果与前述固定抽样方案相同,但抽样个数平均讲要节省些。此例中,抽样个数是随机的,但有一个不能超过的上限20。有的序贯抽样方案,其可能抽样个数无上限,例如,序贯概率比检验的抽样个数就没有上限。
H.F.道奇和H.G.罗米格的二次抽样方案是较早的一个序贯抽样方案。1945年,C.施坦针对方差未知时估计和检验正态分布的均值μ(数学期望)的问题,提出了一个二次抽样方案。依此方案,在事先给定了l>0和0<α<1后,可作出均值μ的一个置信区间,其置信系数为1-α,而长度不超过l。可以证明:当方差未知时,具有这种性质的置信区间在固定样本的情况下不可能找到。由此可以看出序贯抽样方案除了可节省抽样量之外,还有一种作用,即为了达到预定的推断可靠程度(这里为置信系数)及精确程度(这里是以区间长度来刻画),有时必须使用序贯抽样。
例如,估计一事件A的概率p(00及0<α<1,要找到这样的估计,使能以不小于1-α的概率保证估计的相对误差小于等于ε。可以证明,若用固定抽样方案,事先指定自然数n,做n次试验,每次观察A是否发生,则不论n多么大,具有上述性质的不存在。但用下述序贯抽样方案可得到这样的:作试验,观察A是否发生,设到A第一次发生时已作了n1次试验,计算取其整数部分n2,再作n2次试验,记n2次试验中A出现的次数为m,m/n2,则有p(|-p|/p≤ε)≥1-α,而估计具有所指定的性质。
最新修订时间:2022-08-25 15:45
目录
概述
简介
步骤
由来
参考资料