首页 理论教育 数据分组和频数分布的优化与改进

数据分组和频数分布的优化与改进

时间:2023-07-06 理论教育 版权反馈
【摘要】:按品质标志分组或按数量标志分组,或用两种标志结合分组。组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。

数据分组和频数分布的优化与改进

统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型或性质的组成部分的一种统计方法。按品质标志分组或按数量标志分组,或用两种标志结合分组。

品质标志分组:就是用反映事物的属性、性质的标志分组,它可以将总体单位划分为若干性质不同的组成部分。

数量标志分组:就是用事物数量的多少作为分组标志的分组。数量标志可以是绝对数,也可以是相对数,这种分组,是按照具体数值界限划分。

(1)单项式变量分组,是按每个变量值分别列组而形成的数列。

(2)组距式变量分组,是把各变量值按照一定组距进行分组而形成的数列。

组限:在组距数列中,表示各组界限的变量值称为组限。其中较小的变量值称为下限,较大的变量值为上限。

组距:各组上限与下限之差即为组距,组距=上限-下限。

组中值:各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2。组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。(www.xing528.com)

等距分组,各组的组距均相等。

特点:由于各组组距相等,各组次数的分布不受组距大小的影响,它消除了组距影响,与次数密度的分布是一致的,一般呈正态分布

不等距分组,各组组距不相等。

特点:不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少,因此必须消除组距对其分布的影响即需计算次数密度。

编制组距式变量数列时,常常会遇到这样的情况,如学生成绩的分布:60分以下;60—70;70—80等,这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值的计算如下。

下开口的组中值=上限-1/2邻组组距

上开口的组中值=下限+1/2邻组组距

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈