首页 理论教育 品质数据中的四分位差与众数代表性

品质数据中的四分位差与众数代表性

时间:2023-07-03 理论教育 版权反馈
【摘要】:显然,已婚70人为众数,则由结果可知,异众比率为0.42,也即在所给资料中,众数代表性不是很好。四分位差不受极值的影响。由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度,四分位差越大,中位数的代表性越差;反之亦然。四分位差主要用于测度顺序数据和数值型数据的离散程度。

品质数据中的四分位差与众数代表性

一般来说,如果集中趋势用众数描述,则离中趋势用异众比率来描述;如果集中趋势用中位数描述,则离中趋势用四分位差描述。

1)分类数据:异众比率

◎定义4.7:异众比率(variation)又称离异比率或变差比,是指当使用众数指标时非众数组的次数占总次数的比率,用Vr表示。

异众比率计算公式为

式中,Vr为异众比率;Σfi为变量值的总频数(总次数);fm为众数组的频数(众数次数)。

异众比率的意义是指非众数变量值在总体中的比重。异众比率越大,各变量值相对于众数越离散,众数的代表性就越差;异众比率越小,各变量值相对于众数越集中,那么,众数的代表性越好。异众比率主要适合测度分类数据的离散程度,当然对于顺序数据以及数值型数据也可以计算异众比率。

【例4.8】 某单位120名职工婚姻状况,统计结果为:未婚20人,已婚70人,离婚12人,丧偶18人。显然,已婚70人为众数,则(www.xing528.com)

由结果可知,异众比率为0.42,也即在所给资料中,众数代表性不是很好。

2)顺序数据:四分位差

◎定义4.8:四分位差(quartile deviation)是上四分位数与下四分位数的差值,也称内距或四分间距(inter⁃quartile range,IQR),用Qd表示。

四分位差其计算公式为

四分位差是在数列中剔除最大和最小各25%的数据,而反映中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。四分位差不受极值的影响。由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度,四分位差越大,中位数的代表性越差;反之亦然。

四分位差主要用于测度顺序数据和数值型数据的离散程度。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈