(一)异众比率
异众比率是指非众数值的次数之和在总次数中所占比重。
异众比率主要用于衡量一组数据以众数为分布中心的集中程度,即衡量众数代表一组数据一般水平的代表性。其值越小,数据集中程度越高,众数代表性越大。
(二)极差
极差是一组数据的最大值与最小值之差,通常用R表示。
R=x max-x min
对于总体数据而言,极差也就是变量变化的范围或幅度大小,故也称为全距。
组距数列中,极差≈最高组的上限-最低组的下限。
优点:计算简便、含义直观、容易理解。
缺点:它未考虑数据的中间分布情况,不能充分说明全部数据的差异程度。
(三)四分位差
第3四分位数(Q3)与第1四分位数(Q1)之差,常用Qd表示。
计算公式为:
Qd=Q3-Q1
实质上是两端各去掉四分之一的数据以后的极差,表示占全部数据一半的中间数据的离散程度。四分位差越大,表示数据离散程度越大。
四分位差是在一定程度上对极差的一种改进,避免了极端值的干扰。但它对数据差异的反映仍然是不充分的。
四分位差是一种顺序统计量,适用于定序数据和定量数据。尤其是当用中位数来测度数据集中趋势时。
(四)平均差(www.xing528.com)
平均差是各个数据与其均值的离差绝对值的算术平均数,反映各个数据与其均值的平均差距,通常以A.D表示。计算公式为:
平均差含义清晰,能全面地反映数据的离散程度。但取离差绝对值进行平均,数学处理上不够方便,在数学性质上也不是最优的。
(五)方差和标准差
1.方差是各个数据与其均值的离差平方的算术平均数
总体方差(s2)的计算公式为:
注意计算样本方差S2时分母变为n-1.
2.标准差(standard Deviation):方差的算术平方根
总体标准差一般用s表示。
标准差比方差更容易理解。在社会经济现象的统计分析中,标准差比方差的应用更为普遍,经常被用作测度数据与均值差距的标准尺度。
(六)离散系数
前面的各变异指标都是有计量单位的,它们的数值大小不仅取决于数据的离散程度,还要受数据本身水平高低和计量单位的影响。
对不同变量(或不同数据组)的离散程度进行比较时,只有当它们的平均水平和计量单位都相同时,才能利用上述变异指标来分析;否则,须利用离散系数来比较它们的离散程度。
离散系数是极差、四分位差、平均差或标准差等变异指标与算术平均数的比率,以相对数的形式表示变异程度。将极差与算术平均数对比得到极差系数,将平均差与算术平均数对比得到平均差系数。最常用的离散系数是就标准差来计算的,称之为标准差系数:离散系数大,说明数据的离散程度大,其平均数的代表性就差;反之亦然。
(七)标准化值
变量值与其平均数的离差除以标准差后的值称为标准分数(standard score),也称标准化值或z分数。设标准分数为z,则有:
标准分数给出了一组数据中各数值的相对位置。比如,如果某个数值的标准分数为-1.5,就知道该数值低于平均数1.5倍的标准差。式(3.13)也就是我们常用的统计标准化公式,在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。