首页 理论教育 统计学原理:离散系数与变异程度的关系

统计学原理:离散系数与变异程度的关系

更新时间:2025-01-15 工作计划 版权反馈
【摘要】:四分位差是在一定程度上对极差的一种改进,避免了极端值的干扰。(六)离散系数前面的各变异指标都是有计量单位的,它们的数值大小不仅取决于数据的离散程度,还要受数据本身水平高低和计量单位的影响。离散系数是极差、四分位差、平均差或标准差等变异指标与算术平均数的比率,以相对数的形式表示变异程度。设标准分数为z,则有:标准分数给出了一组数据中各数值的相对位置。

(一)异众比率

异众比率是指非众数值的次数之和在总次数中所占比重。

异众比率主要用于衡量一组数据以众数为分布中心的集中程度,即衡量众数代表一组数据一般水平的代表性。其值越小,数据集中程度越高,众数代表性越大。

(二)极差

极差是一组数据的最大值与最小值之差,通常用R表示。

R=x max-x min

对于总体数据而言,极差也就是变量变化的范围或幅度大小,故也称为全距。

组距数列中,极差≈最高组的上限-最低组的下限。

优点:计算简便、含义直观、容易理解。

缺点:它未考虑数据的中间分布情况,不能充分说明全部数据的差异程度。

(三)四分位差

第3四分位数(Q3)与第1四分位数(Q1)之差,常用Qd表示。

计算公式为:

Qd=Q3-Q1

实质上是两端各去掉四分之一的数据以后的极差,表示占全部数据一半的中间数据的离散程度。四分位差越大,表示数据离散程度越大。

四分位差是在一定程度上对极差的一种改进,避免了极端值的干扰。但它对数据差异的反映仍然是不充分的。

四分位差是一种顺序统计量,适用于定序数据和定量数据。尤其是当用中位数来测度数据集中趋势时。

(四)平均差(www.xing528.com)

平均差是各个数据与其均值的离差绝对值的算术平均数,反映各个数据与其均值的平均差距,通常以A.D表示。计算公式为:

平均差含义清晰,能全面地反映数据的离散程度。但取离差绝对值进行平均,数学处理上不够方便,在数学性质上也不是最优的。

(五)方差和标准差

1.方差是各个数据与其均值的离差平方的算术平均数

总体方差(s2)的计算公式为:

注意计算样本方差S2时分母变为n-1.

2.标准差(standard Deviation):方差的算术平方根

总体标准差一般用s表示。

标准差比方差更容易理解。在社会经济现象的统计分析中,标准差比方差的应用更为普遍,经常被用作测度数据与均值差距的标准尺度。

(六)离散系数

前面的各变异指标都是有计量单位的,它们的数值大小不仅取决于数据的离散程度,还要受数据本身水平高低和计量单位的影响。

对不同变量(或不同数据组)的离散程度进行比较时,只有当它们的平均水平和计量单位都相同时,才能利用上述变异指标来分析;否则,须利用离散系数来比较它们的离散程度。

离散系数是极差、四分位差、平均差或标准差等变异指标与算术平均数的比率,以相对数的形式表示变异程度。将极差与算术平均数对比得到极差系数,将平均差与算术平均数对比得到平均差系数。最常用的离散系数是就标准差来计算的,称之为标准差系数:离散系数大,说明数据的离散程度大,其平均数的代表性就差;反之亦然。

(七)标准化值

变量值与其平均数的离差除以标准差后的值称为标准分数(standard score),也称标准化值或z分数。设标准分数为z,则有:

标准分数给出了一组数据中各数值的相对位置。比如,如果某个数值的标准分数为-1.5,就知道该数值低于平均数1.5倍的标准差。式(3.13)也就是我们常用的统计标准化公式,在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈