1)分类数据:众数
◎定义4.2:众数(mode)是指一组数据出现次数最多的变量值,通常用Mo表示。
众数主要用于测度分类数据的集中趋势,同时也适用于顺序数据以及数值型数据集中趋势的测度值。需注意的是,只有当数据较多,具有明显的集中趋势时,计算众数才有意义,才可利用它来作为某种决策的参考依据。例如,纺织企业职工“性别”中“女性”人数最多,则“女性”为众数。又如,鞋厂在制订各种尺码鞋子的生产计划时,市场上销量最大的型号是众数,也是生产厂家或经销商应该重点生产和销售的型号。
【思考与讨论】
第3章例3.1中提供“性别”和“家庭所在地区”有无“众数”?
【例4.1】 某城市随机对200位居民关注广告类型的情况进行了调查,并将每位居民选择的广告类型都记录下来了,请根据表4.1中不同广告类型的频数分布,计算众数。
表4.1 不同广告类型的频数分布表
从表4.1可以看出,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%。因此,众数为“商品广告”这一类别,即Mo=商品广告。该众数说明居民对商品广告的关注度较高。
众数是一个位置代表值,它的特点是不受数据极端值的影响,局限性是应用场合比较有限。例如,在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的众数值为代表。另外,众数具有不确定性。如果数据的分布没有明显的集中趋势,众数就不存在;如果有多个高峰点,就有多个众数。例如,一组变量为1,2,2,3,4,4,5,6,则众数是2和4;若变量值为2,2,3,3,4,4,则不存在众数,因为2,3和4出现的次数一样,没有明显的集中趋势。
2)顺序数据:中位数和四分位数
(1)中位数
◎定义4.3:中位数是一组数据按一定顺序排序后,处于中间位置上的数值,用Me表示。
中位数将全部数据排序后等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。所以只适用于顺序数据和数值型数据。用中位数来代表总体中所有变量值的一般水平,可避免极端值的影响,在有的情况下更具有代表性。
对于未经过分组整理的顺序数据和数值型数据,其中位数的计算步骤如下:
第1步:排序。
第2步:确定中位数的位置,其公式为
式中,n为数据的个数。
第3步:计算中位数的数值
【例4.2】 在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:元),计算人均月收入的中位数:
960 850 1500 750 2000 1650 780 1250
解 第1步:先将上面的数据排序,结果为
750 780 850 960 1080 1250 1500 1650 2000
第2步:确定中位数的位置=(9+1)÷2=5
第3步:计算中位数的数值,即
假定抽取了10个家庭,每个家庭的人均月收入数据为(www.xing528.com)
660 750 780 850 960 1080 1250 1500 1650 2000
【思考与讨论】
1.某车间的一个生产小组共7名生产工人,他们的日产量(件)为:6,8,4,6,9,14,12(单位:件),计算这7名生产工人日产量的中位数。
2.如果是顺序数据,如何确定中位数?
(2)四分位数
四分位数是把数据按照从小到大顺序排列后,将变量值分为4个相等部分,对应的3个四分位点的具体变量值。
◎定义4.4:四分位数(quartile)是指一组数据排序后处于25%和75%位置上的值,也称四分位点。
位置点的确定方法如下,然后由四分位点的位置确定四分位数:
【例4.3】 根据例4.1中9个家庭的收入调查数据,计算人均月收入的四分位数。
即Q1在第2个数值(780)和第3个数值(850)之间0.5的位置上,故
即Q3在第7个数值(1500)和第8个数值(1650)之间0.5的位置上,故
Q1与Q3之间包含了50%的数据,因此,可以说有一半的家庭人均月收入在815~1575元。
【思考与讨论】
12个工人日加工零件数分别为15,16,18,18,21,22,23,23,23,24,26,28,求其四分位数。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。