测度数值型数据离散程度的标志变异指标主要有极差、平均差、方差与标准差。其中,最常用的方法是方差和标准差。
1)极差
◎定义4.9:极差(range)也称全距,是一组数据的最大值与最小值之差,用R表示。
极差的计算公式为
式中,max(xi)和min(xi)分别表示一组数据的最大值和最小值。
【例4.9】 现有甲乙两组数据资料:
甲组:20 40 60 80 100
乙组:50 55 60 65 70
试计算两组数据的极差。
解 两组数据的极差为
R甲=100-20=80
R乙=70-50=20
虽然甲乙两组数据的算术平均数相同,都为60,但两组数据变动范围是不一样的。根据极差的定义可知,甲组数据之间的差异远远大于乙组,即乙组平均数的代表性要大于甲组。
极差只能表明两极端值之间的离散程度,不能反映所有变量值的离散程度。考虑所有变量值的离散程度,就要用“平均差”。
2)平均差
◎定义4.10:平均差(mean deviation)也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用Md表示。
由于各变量值与其平均数离差之和等于零,因此,在计算平均差时,应取绝对值。平均差的计算根据掌握数据资料不同而采用简单平均式和加权平均式两种方法。
(1)简单平均式
如果掌握的是未分组资料时,采用简单平均式计算。其公式为
【例4.10】 在5,11,7,8,9这组数据中,其平均数为8,计算平均差。
解 平均差为
在可比的情况下,一般平均差的数值越大,则其平均数的代表性越小,说明该组变量值分布越分散;反之,平均差的数值越小,则其平均数的代表性越大,说明该组变量值分布越集中。本题中平均差较小,说明该组数据分布较集中。
(2)加权平均式
如果掌握的是已分组资料或分配数列时,计算平均差就应该采用加权平均式。其公式为
【例4.11】 某企业100名工人日产量分组资料见表4.4,计算100名工人日产量平均差。
表4.4 某企业100名员工日产量分组资料表
解 根据式(4.15),则
上列资料表明,全厂每个职工的日产量与全厂工人的日平均产量平均相差7.25件。
3)方差与标准差
◎定义4.11:方差(variance)是指总体中各观察值与其平均值离差平方的平均数,通常用σ2表示。
◎定义4.12:标准差(standard deviation)是指方差的平方根,通常用σ表示。
方差(或标准差)是测度离散程度最常用的指标,它反映了每个数据与其平均数相比平均相差的数值。因此,它是离散程度最科学的测度的指标,实践中应用十分广泛。
方差和标准差的思路与平均差基本相同,只是在数学处理方法上与平均差不同:对于总体中各变量值与算术平均数的正负离差相互抵消为0的问题,平均差采用绝对值的方法来避免。而标准差则是采用平方的方法来避免。然后再对离差的平方计算算术平均数,并开方取其正根,求出标准差。方差和标准差的处理方法得到了数学支持。(www.xing528.com)
(1)总体方差与标准差
设总体方差为σ2,标准差为σ,均值为μ,组中值为Mi。对于未经整理的原始数据,总体方差和标准差的计算公式为
式中,xi为原始数据;N为原始数据的个数。
对于组距分组数据,总体方差和标准差的计算公式为
式中,k为组距分组的组数;N=Σfi。
(2)样本方差与标准差
式中,xi为原始数据;n为原始数据的个数。
对于组距分组数据,样本方差和标准差的计算公式为
标准差与变量值的计量单位相同,其实际意义比较清楚。因此,在对社会经济现象进行分析时主要使用标准差。
【例4.12】 某车间有两个班组10位工人的日产零件数排列如下:
甲组:20,25,30,35,50,70,75,85,90,120
乙组:50,51,52,53,56,60,62,71,72,73
即甲乙两组在日均产量相等的情况下,甲组标准差为31.46件,乙组标准差为8.6件,说明甲组平均数的代表性小于乙组。
【例4.13】 根据表4.5中的数据,计算50个家庭住房面积的样本标准差。
表4.5 某城市50个家庭住房面积样本标准差计算表
解 根据上面的计算公式,得
结果表明,每个家庭的住房面积与平均数相比,平均相差24.04m2。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。