组距分组_数值型数据分组的形式 - 威林百科weilinceramic.com

组距分组

数值型数据分组的形式

组距分组是将全部变量值依次划分为若干个区间，并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。离散变量的整数值如果变动幅度较大，而且总体单位数N又很大，则也要进行组距分组。在组距分组中，各组之间的取值界限称为组限，一个组的最小值称为下限，最大值称为上限；上限与下限的差值称为组距；上限与下限值的平均数称为组中值，它是一组变量值的代表值。

基本内容

组距分组是将全部变量值依次划分为若干个区间，并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。

在组距分组中，各组之间的取值界限称为组限，一个组的最小值称为下限，最大值称为上限；上限与下限的差值称为组距；上限与下限值的平均数称为组中值，它是一组变量值的代表值。

把所有数据分成若干组，每个小组的两个端点之间的距离（组内数据的取值范围）称为组距。

步骤

1. 确定组数。一组数据的组数一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征，因此组数的多少应适中。如组数太少，数据的分布就会过于集中，组数太多，数据的分布就会过于分散，这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。

2.确定各组的组距。组距是一个组的上限与下限的差，可根据全部数据的最大值和最小值（即极差）及所分的组数来确定，即组距=（最大值－最小值）/组数。

3.根据分组整理成频数分布表。

原则

采用组距分组时，需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组，不能在其他组中重复出现；“不漏”是指组别能够穷尽，即在所分的全部组别中每项数据都能分在其中的某一组，不能遗漏。

为解决“不重”的问题，统计分组时习惯上规定“上组限不在内”，即当相邻两组的上下限重叠时，恰好等于某一组上限的变量值不算在本组内，而计算在下一组内。而对于连续变量，可以采取相邻两组组限重叠的方法，根据“上组限不在内”的规定解决不重的问题，也可以对一个组的上限值采用小数点的形式，小数点的位数根据所要求的精度具体确定。例如，对零件尺寸可以分组为10－11.99、12－13.99、14－15.99，等等。

在组距分组中，如果全部数据中的最大值和最小值与其他数据相差悬殊，为避免出现空白组（即没有变量值的组）或个别极端值被漏掉，第一组和最后一组可以采取“××以下”及“××以上”这样的开口组。开口组通常以相邻组的组距作为其组距。为了统计分析的需要，有时需要观察某一数值以下或某一数值以上的频数或频率之和，还可以计算出累积频数或累积频率。

应用

统计整理是对调查过程中得到的大量统计资料加工整理、汇总、列表的过程，处于统计工作的中间环节，起着承前启后的作用。编制组距变量数列是数据整理过程中的一个关键环节，它不仅直接影响统计资料整理的科学性和准确性，而且最终影响着统计分析结果的真实性。

参考资料

最新修订时间：2023-01-05 10:10

条目作者

小编

资深百科编辑

概述

基本内容

步骤

参考资料