频率直方图(frequency histogram)亦称
频率分布直方图。
统计学中表示
频率分布的
图形。在
直角坐标系中,用横轴表示
随机变量的取值,横轴上的每个小区间对应一个组的组距,作为小矩形的底边;纵轴表示频率与组距的比值,并用它作小矩形的高,以这种小矩形构成的一组图称为频率直方图。
基本介绍
设 是总体的样本,其最小值记为 ,最大值记为b,又设 是小于 的最大整数, 是大于b的最小整数,将区间 等分成m个小区间
显然,各小区间的长度均为 ,然后统计出样本观测值落入各小区间的
频数 ,并计算频率 。以每个小区间为底,以 为高在
平面直角坐标系内作小矩形,这些小矩形组成的图形称为频率直方图。显然第 个小矩形的面积恰好是样本观测值落人第 个小区间内的频率 。若总体X的概率密度为 ,则X的观测值落入第 个小区间内的概率为 ,其几何意义是以 为底,概率密度曲线 为顶的曲边梯形的面积,于是有
因此,当样本容量n无限增大时,频率直方图的阶梯形折线将逼近于概率密度曲线。也就是说,当n充分大时,频率直方图近似地反映了概率密度曲线的大致形状,在统计推断中常常由此提出对总体分布形式的假设。
例题解析
【例1】某地区连续50年中四月份平均气温资料如下(单位:℃):
6.9 4.1 6.6 5.2 6.4 7.9 8.6 3.0 4.4 6.7
7.1 4.7 9.1 6.8 8.6 5.2 5.8 7.9 5.6 8.8
8.1 5.7 8.4 4.1 6.4 6.2 5.2 6.8 5.6 5.6
6.8 8.2 6.4 4.8 6.9 7.1 9.7 6.4 7.3 6.8
7.1 4.8 5.8 6.5 5.9 7.3 5.5 7.4 6.2 7.7
以上述资料为依据,推断该地区四月份平均气温的分布类型。
解: 样本观测值中最小值 ,最大值 ,取 。将区间 等分为7个小区间,区间长度为1,计算样本观测值落人各小区间的频数与频率,见表1。
根据表1作出频率直方图,见图1,由直方图可见,该地区四月份平均气温近似服从正态分布。
这个结论仅仅是对样本数据的统计分析,对总体分布形式提出了一个假设,它是否符合实际,还要进行检验。
解题注意:可以根据纵轴标示区分是频数直方图还是频率直方图。
难点:从频率直方图得到数字特征(
均值、
中位数、
众数等)。
【例2】将容量为n的样本中的数据分成6组,绘制
频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于( )。
(A)80 (B)75 (C)70 (D)65 (E)60
解: 频率=频数/总数,所以频率之比=频数之比,所以容量,选(E)。
【例3】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图2所示,则其抽样的100根中,棉花纤维的长度小于20mm的约有( )根。
(A)18 (B)20 (C)22 (D)25 (E)30
解:小于20 mm的频率之和为(0.01+0.01+0.04)×5=0.3,所以100根中有30根,选E。