统计分组是数据整理中的一项重要工作,是指根据统计研究的目的和客观现象的内在特点,按某个变量(或几个变量)把被研究的总体划分成为若干个不同性质的组,然后再统计出各组的
频数,就形成了一张
频数分布表。分组时所依据的特征或标准称为统计分组标志,它有
品质标志和
数量标志两种。
按数量标志分组时,可先将数据进行排序,然后再根据需要进行分组。按数量标志分组的方法很多,主要有两种:一是单变量值分组,二是
组距分组。
单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量,且变量值较少的情况下使用。在数据较多的情况下,单变量值分组由于组数较多而不便于观察数据分布的特征和规律,而且对于连续变量或变量值较多的情况,可采用组距分组。
组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是
数值型数据分组的基本形式。离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则也要进行组距分组。
统计整理是对调查过程中得到的大量统计资料加工整理、汇总、列表的过程,处于统计工作的中间环节,起着承前启后的作用。准确使用单数量值分组和组距分组是数据整理过程中的一个关键环节,不仅直接影响统计资料整理的科学性和准确性,而且最终影响着统计分析结果的真实性。