在n次独立重复的
伯努利试验中,设每次试验中事件A发生的
概率为p。用X表示
n重伯努利试验中事件A发生的次数,则X的可能取值为0,1,…,n,且对每一个k(0≤k≤n),事件{X=k}即为“n次试验中事件A恰好发生k次”,
随机变量X的离散概率分布即为二项分布(Binomial Distribution)。
定义
在概率论和统计学中,二项分布是n个独立的成功/失败试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为
伯努利试验。实际上,当n=1时,二项分布就是
伯努利分布。
一般地,如果随机变量服从参数为和的二项分布,我们记为或。n次试验中正好得到k次成功的概率由概率质量函数给出:
式中k=0,1,2,…,n,是
二项式系数(这就是二项分布名称的由来),又记为或者。 该公式可以用以下方法理解:我们希望有k次成功(p)和n−k次失败(1 −p)。并且,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有个不同的方法。
期望方差
如果(也就是说,X是服从二项分布的随机变量),那么X的
期望值为:
这个事实很容易证明。首先假设有一个伯努利试验。试验有两个可能的结果:1和0,前者发生的概率为p,后者的概率为1−p。该试验的期望值等于μ= 1 · p+ 0 · (1−p) =p。该试验的方差也可以类似地计算:σ2= (1−p)2·p+ (0−p)2·(1−p) =p(1 − p)。
一般的二项分布是n次独立的伯努利试验的和。它的期望值和方差分别等于每次单独试验的期望值和方差的和:
协方差
如果有两个服从二项分布的随机变量X和Y,我们可以求它们的
协方差。利用协方差的定义,当n= 1时我们有:
E(XY)为当X和Y都等于1时的概率,而E(X)和E(Y)分别为X= 1和Y= 1的概率。定义为X和Y都等于1的概率,便得到:
对于n次独立的试验,我们便有:
如果X和Y是相同的变量,便化为前文所述的的二项分布方差公式。
图形特点
从图1中可以看出,对于固定的n以及p,当k增加时,概率P{X=k}先是随之增加直至达到最大值,随后单调减少。可以证明,一般的二项分布也具有这一性质,且:
注:[x]为取整函数,即为不超过x的最大整数。
关系
两个二项分布的和
如果X~ B(n,p)和Y~ B(m,p),且X和Y相互独立,那么X+Y也服从二项分布;它的分布为:
伯努利分布
伯努利分布是二项分布在n= 1时的特殊情况。X~ B(1,p)与X~ Bern(p)的意思是相同的。相反,任何二项分布B(n,p)都是n次独立伯努利试验的和,每次试验成功的概率为p。
泊松近似
当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于
泊松分布。因此参数为λ=np的泊松分布可以作为二项分布B(n,p)的近似,近似成立的前提要求n足够大,而p足够小,np不是很小。
正态近似
如果n足够大,那么分布的偏度就比较小。在这种情况下,如果使用适当的连续性校正,那么B(n,p)的一个很好的近似是正态分布:
当n越大(至少20)且p不接近0或1时近似效果更好。不同的经验法则可以用来决定n是否足够大,以及p是否距离0或1足够远,其中一个常用的规则是np和n(1 −p)都必须大于 5。
应用
在生产实践过程中会有来自很多方面因素的影响,所有这些因素的综合作用导致过程动荡,从而体现出一些质量特性的不稳定性. 概率论与数理统计一些统计技术可以帮助我们了解和监控这些波动,帮助我们朝着有利于我们的方向发展。在生产实践中有一类现象,我们研究的对象只产生两种可能结果,他们的分布规律就是二项分布,二项分布应用很广泛。
经济学
在保险业务中,我们经常需要根据实际情况适当调整保费问题,以保证保险公司的利润达到一定要求,同时保险公司的业务量也达到要求,对于这一类问题,可以对已知实际情况做一定的概率分析。例如某保险公司有10000客户购买
人身意外保险,该公司规定每人每年付公司120元 ,若遇意外死亡,公司将赔偿10000元。若每人每年死亡率为0.006,从而不难利用二项分布算出公司获利、亏本的各种情形了。实际上对于随机现象,了解其分布非常有意义,利用概率论讨论得到的结果对保险公司有一定的指导意义。
管理学
管理学在生产实践过程中我们经常需要配备一些设备,但是设备经常需要维修。为了保证设备正常工作,需配备适量的维修工人(工人配备多了就浪费,配备少了又影响生产)例如现有同类型设备300台,各台工作是相互独立的,发生故障的概率都是0.01。假设通常情况下一台设备的故障由一个人处理,可由二项分布算出至少需配备多少工人,才能保证设备发生故障但不能及时维修的概率小于0.01。
医学
在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。二项分布(binomialdistribution)可以对这类只具有两种互斥结果的离散型随机事件的规律性进行描述。