集中趋势和离中趋势是数据分布的两个重要特征,但要全面了解数据分布的特点,我们还需要知道数据分布的形状是否对称、偏斜程度以及分布的偏平程度等。偏态和峰态就是对分布形状的测度。
4.3.1 偏态(skewness)
“偏态”一词是由统计学家皮尔森于1895年首次提出的。偏态是对数据分布对称性的测度。对数据分布的非对称性程度的测度则需要计算偏态系数(SK)。偏态系数的计算方式有很多。在根据未分组的原始数据计算的偏态系数时,通常采用下面的公式:
根据分组数据计算偏态系数时,通常采用下面公式:
如果一组数据的分布是对称的,则偏态系数等于0; 如果偏态系数明显不等于0,表明分布是非对称的。当偏态系数为正值时,表明正偏离差值较大,可以判断为正偏或右偏; 反之,当偏态系数为负值时,表明负偏离差值较大,可以判断为负偏或左偏。偏态系数的数值越大,表示偏斜程度就越大。
[例4.12]根据例4.9的数据,计算每个职工月工资的偏态系数。
解: 计算过程见表4-6。
表4-6 月工资的偏态及峰态计算表
将计算结果代入公式得:(www.xing528.com)
由计算结构可以看出,偏态系数为正值,说明职工工资的分布为右偏分布。
4.3.2 峰态(kurtosis)
“峰态”一词是由统计学家皮尔森于1895年首次提出的。峰态是对数据分布平峰或尖峰程度的测度。对数据分布的峰态的测度则需要计算峰态系数(k)。峰态系数的计算方式有很多。在根据未分组的原始数据计算的峰态系数时,通常采用下面的公式:
根据分组数据计算峰态系数时,通常采用下面公式:
如果一组数据服从标准正态分布,则峰态系数等于0; 如果峰态系数明显不等于0,表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布。当峰态系数为正值时,表明为尖峰分布; 反之,当峰态系数为负值时,表明为平峰分布。用峰态系数说明数据分布的尖峰和扁平程度,是通过与标准正态分布的峰态系数进行比较而言的。
[例4.13]根据例4.9的数据,计算每个职工月工资的峰态系数。
解: 根据表4-6的计算结果,代入公式得:
由于k=-0.385<0,说明职工工资数据的分布与正态分布相比略有一些平峰。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。