频数分布直方图
统计图
通过长方形的高代表对应组的频数(因为组距是一个常数,为了画图和看图方便,通常直接用高表示频数),这样的统计图称为频数分布直方图.它能:①清楚显示各组频数分布情况;②易于显示各组之间频数的差别.
基本概念
1.频数:数字出现的次数有的多有的少,或者说它们出现的频繁程度不同,我们称每个对象出现的次数为频数。
注:在统计频数多少的时候,我们一般通过数“正”字的方法累计.也可使用其他方法.
2.频率:每个对象出现次数与总次数的比值为频率。
3.组数:把全体样本分成的组的个数称为组数.
4.组距:把所有数据分成若干个组,每个小组的两个端点的距离。
5.极差:是指一组数据中最大数据与最小数据的差。组距=[极差除以组数]+1([ ]表示取整)
6、频数直方图:有若干个宽等于组距、高度表示每一组频数的长方形组成的统计图
思想方法
1.数形结合:从统计图中,能看出各组数据的特点,可进一步应用这些数据特点解决实际问题.通过整理数据,根据要求绘制统计图,可进一步分析数据、做出决策.
2.类比:绘制频数分布直方图和绘制条形图类似,如果长方形的宽一样,那么长方形的高度之比就是各组内数据个数之比.
制作步骤
1.找出所有数据中的最大值和最小值,并算出它们的差.
2.决定组距和组数.
3.确定分点
4.列出频数分布表
5.画频数分布直方图.
频数画法
①集中和记录数据,求出其最大值最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。 ②将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。 ③计算组距的宽度。用组数去除最大值和最小值之差,求出组距的宽度。 ④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为组中值减去组距的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。 ⑤统计各组数据出现频数,作频数分布表。 ⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。 根据最大数据与最小数据的差值,决定组距的大小,组距和组数的确定没有固定的标准,一般数据越多,分成的组数就越多,当数据不超过50个,可以分5~7组;当数据在50~100之间时,一般分5~17组。
画图
我们可以在直方图的基础上来画,先取直方图各矩形上边的中点,然后在横轴上取两个频数为0的点,这两点分别与直方图左右两端的两个长方形的组中值(矩形宽的中点)相距一个组距,将这些点用线段依次联结起来,就得到了频数分布折线图
主要区别
1.条形图是用条形的高度表示频数的大小,而直方图实际上是用长方形的面积表示频数,当长方形的宽相等的时候,把组距看成“1”,用矩形的的高表示频数;
2.条形图中,横轴上的数据是孤立的,是一个具体的数据,而直方图中,横轴上的数据是连续的,是一个范围;
3.条形图中,各长方形之间有空隙,而直方图中,各长方形是靠在一起的,中间无空隙。
注意事项
运用频数分布直方图进行数据分析的时候,一般先列出它的分布表,其中有几个常用的公式:各组频数之和等于抽样数据总数;各组频率之和等于1;数据总数×各组的频率=相应组的频数。
画频数分布直方图的目的,是为了将频数分布表中的结果直观、形象地表示出来,其中组距、组数起关键作用,分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征,当数据在100以内时,一般分5~12组。
参考资料
最新修订时间:2023-12-10 14:29
目录
概述
基本概念
思想方法
参考资料