在
概率论和统计学中,数学期望(mathematic expectation)(或
均值,亦简称期望)是试验中每次可能结果的
概率乘以其结果的总和,是最基本的
数学特征之一。它反映随机变量平均取值的大小。
历史故事
在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,一共进行五局,赢家可以获得100法郎的奖励。当比赛进行到第四局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?
用概率论的知识,不难得知,甲获胜的可能性大,乙获胜的可能性小。
因为甲输掉后两局的可能性只有(1/2)×(1/2)=1/4,也就是说甲赢得后两局或后两局中任意赢一局的概率为1-(1/4)=3/4,甲有75%的期望获得100法郎;而乙期望赢得100法郎就得在后两局均击败甲,乙连续赢得后两局的概率为(1/2)*(1/2)=1/4,即乙有25%的期望获得100法郎奖金。
可见,虽然不能再进行比赛,但依据上述可能性推断,甲乙双方最终胜利的客观期望分别为75%和25%,因此甲应分得奖金的100*75%=75(法郎),乙应分得奖金的的100×25%=25(法郎)。这个故事里出现了“期望”这个词,数学期望由此而来。
离散型
如果随机变量只取得有限个值或无穷能按一定次序一一列出,其值域为一个或若干个有限或无限区间,这样的随机变量称为离散型随机变量。
离散型随机变量的一切可能的取值与对应的概率乘积之和称为该离散型随机变量的数学期望(若该求和绝对收敛),记为。它是简单算术平均的一种推广,类似加权平均。
公式
离散型随机变量X的取值为,为X对应取值的概率,可理解为数据出现的频率,则:
例子
某城市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个。
则此城市中任一个家庭中孩子的数目是一个随机变量,记为X。它可取值0,1,2,3。
其中,X取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03。
则,它的数学期望,即此城市一个家庭平均有小孩1.11个,当然人不可能用1.11个来算,约等于2个。
设Y是随机变量X的函数:(是连续函数)
它的分布律为若绝对收敛,则有:
连续型
设连续性随机变量X的概率密度函数为f(x),若积分绝对收敛,则称积分的值为随机变量的数学期望,记为E(X)。
若随机变量X的
分布函数F(x)可表示成一个非负
可积函数f(x)的积分,则称X为
连续性随机变量,f(x)称为X的
概率密度函数(分布密度函数)。
数学期望完全由随机变量X的概率分布所确定。若X服从某一分布,也称是这一分布的数学期望。
定理
若随机变量Y符合函数,且绝对收敛,则有:
该定理的意义在于:如果要求时不需要算出Y的分布律或者概率分布,只要利用X的分布律或概率密度即可。
上述定理还可以推广到两个或以上随机变量的函数情况。
设Z是随机变量X、Y的函数(g是连续函数),Z是一个一维随机变量,二维随机变量(X,Y)的概率密度为,则有:
区别
离散型随机变量与连续型随机变量都是由随机变量取值范围(取值)确定。
变量取值只能取离散型的自然数,就是离散型随机变量。例如,一次掷20个硬币,k个硬币正面朝上,k是随机变量。k的取值只能是自然数0,1,2,…,20,而不能取小数3.5、无理数,因而k是离散型随机变量。
如果变量可以在某个区间内取任一实数,即变量的取值可以是连续的,这随机变量就称为连续型随机变量。例如,公共汽车每15分钟一班,某人在站台等车时间x是个随机变量,x的取值范围是[0,15),它是一个区间,从理论上说在这个区间内可取任一实数3.5、无理数等,因而称这随机变量是连续型随机变量。
性质
设C为一个常数,X和Y是两个随机变量。以下是数学期望的重要性质:
1.
2.
3.
4.当X和Y相互独立时,
性质3和性质4可以推到到任意有限个相互独立的随机变量之和或之积的情况。
证明:
这里只对连续性随机变量的情况加以证明,对离散型的证明只要将证明中的积分改为和式即可。
1.永远都只能取C,常数C的平均数还是它本身。
2.
3.设二维随机变量的概率密度函数为。
4.若X和Y相互独立,其边缘概率密度函数为,有
应用
经济决策
假设某一超市出售的某种商品,每周的需求量X在10至30范围内等可能取值,该商品的进货量也在10至30范围内等可能取值(每周只进一次货)超市每销售一单位商品可获利500元,若供大于求,则削价处理,每处理一单位商品亏损100元;若供不应求,可从其他超市调拨,此时超市商品可获利300元。试计算进货量多少时,超市可获得最佳利润?并求出最大利润的期望值。
分析:由于该商品的需求量(销售量)X是一个随机变量,它在区间[10,30]上均匀分布,而销售该商品的利润值Y也是随机变量,它是X的函数,称为随机变量的函数。题中所涉及的最佳利润只能是利润的数学期望(即平均利润的最大值)。因此,本问题的解算过程是先确定Y与X的函数关系,再求出Y的期望E(Y)。最后利用极值法求出E(Y)的极大值点及最大值。
抽奖问题
假设某百货超市现有一批快到期的日用产品急需处理,超市老板设计了免费抽奖活动来处理掉了这些商品。纸箱中装有大小相同的20个球,10个10分,10个5分,从中摸出10个球,摸出的10个球的分数之和即为中奖分数,获奖如下:
一等奖 100分,冰柜一个,价值2500元;
二等奖 50分, 电视机一个,价值1000元;
三等奖 95分, 洗发液8瓶,价值176元;
四等奖 55分, 洗发液4瓶,价值88元;
五等奖 60分, 洗发液2瓶,价值44元;
六等奖 65分, 牙膏一盒, 价值8元;
七等奖 70分, 洗衣粉一袋,价值5元;
八等奖 85分, 香皂一块, 价值3元;
九等奖 90分, 牙刷一把, 价值2元;
十等奖 75分与80分为优惠奖,只収成本价22元,将获得洗发液一瓶;
分析:表面上看整个活动对顾客都是有利的,一等奖到九等奖都是白得的,只有十等奖才收取一点成本价。但经过分析可以知道商家真的就亏损了吗?顾客就真能从中获得抽取大奖的机会吗?求得其期望值便可真相大白。摸出10个球的分值只有11种情况,用X表示摸奖者获得的奖励金额数,计算得到E(X)=-10.098,表明商家在平均每一次的抽奖中将获得10.098元,而平均每个抽奖者将花 10.098元来享受这种免费的抽奖。 从而可以看出顾客真的就占到大便宜了吗?相反,商家采用这种方法不仅把快要到期的商品处理出去了,而且还为超市大量集聚了人气,一举多得。此百货超市老板运用数学期望估计出了他不会亏损而做了这个免费抽奖活动,最后一举多得,从中可看出了数学期望这一科学的方法在经济决策中的重要性。
体育比赛问题
乒乓球是中国的国球,上世纪乒乓球也为中国带来一些外交。中国队在这项运动中具有绝对的优势。现就乒乓球比赛的安排提出一个问题:假设德国队(德国队名将波尔在中国也有很多球迷)和中国队比赛。赛制有两种,一种是双方各出3人,三场两胜制, 一种是双方各出5人,五场三胜制,哪一种赛制对中国队更有利?
分析:由于中国队在这项比赛中的优势,不妨设中国队中每一位队员德国队员的胜率都为60%,接着只需要比较两个队对应的数学期望即可。