1)实验目的
①掌握利用Excel的“描述统计”工具计算描述统计指标的方法。
②掌握利用Excel的“统计函数”计算描述统计指标的方法。
2)实验资料与要求
(1)资料
【例4.19】 某班有50名学生,他们的体重数据见表4.9,用Excel计算出这些数据的描述统计量。
表4.9 50名学生的体重数据/kg
(2)要求
①计算描述集中趋势的统计指标:算术平均数、中位数、众数。
②计算描述离中趋势的统计指标:极差、方差、标准差、离散系数。
③计算描述形态分布的统计指标:偏态系数、峰态系数。
3)实验步骤与结果
(1)未分组数据统计指标的计算
解 用Excel计算表中数据的描述统计量的具体操作步骤如下:
第1步:将表中的数据输入Excel表中的某一列,在这里把这些数据输入Excel中的第一列(见图4.4)。
图4.4 插入描述统计对话框
第2步:在工具栏中选择“工具”,在下拉菜单中选择“数据分析”选项,在分析工具中选择“描述统计”(见图4.5)。
图4.5 描述统计的对话框
第3步:当出现对话框时,在“输入区域”方框内输入A2:A51,在“输出区域”中选择输出区域C1(或选择“新工作表”),选择“汇总统计”(该选项给出全部描述统计量),然后选择“确定”,就会出现如图4.6所示的输出结果。
上面结果中,平均指算术平均数;标准误差指样本平均数的标准差;中值即中位数;模式指众数;标准偏差指样本标准差;峰值即峰度系数;偏斜度即偏度系数;区域指极差。从表中的结果可以看出,学生体重的最大值达到69kg,最小值有36kg,平均体重为49.84kg,峰度为0.15>0,说明学生的体重分布与正态分布相比略有一些尖峰,偏度为0.27,是正值,但数值不是很大,说明学生的体重分布为右偏分布,且偏斜程度不是很大。
(2)已分组数据统计指标的计算
Excel中用于计算已分组数据统计指标的方法是:利用“统计函数”“数学函数”“公示编辑”和“公式复制”等功能进行。基本步骤如下:
图4.6 Excel计算出的描述统计量结果
第1步:输入分组数据。按列表形式输入分组数据,包括分组和频数。
第2步:计算相关数据。通过编辑公式并拖拽复制公式计算出与统计指标相关的数据,如组中值、频率、累积频数、与均值的偏差等。
第3步:计算统计指标。将相关数据代入统计指标公式即可计算出所需要的指标数值。
【学习指导与小结】
本章从3个方面介绍了统计数据分布特征的测度和描述:一是数据分布的集中趋势;二是数据分布的离散程度;三是数据分布的偏态和峰态。本章各节的主要内容和学习要点见表4.10。
表4.10 本章各节的主要内容和学习要点
续表
注:“加粗”部分为重点学习要点,应当重点学习并掌握。
【常用术语】
众数 中位数 四分位数 平均数 几何平均数 异众比率 四分位差 极差 平均差 方差 标准差 标准分数 离散系数 偏态 偏态系数 峰态 峰态系数
【案例讨论】
可口可乐在俄罗斯的包装越变越小[3]
可口可乐公司是世界第一大软饮料销售公司。每天平均有9000万份可口可乐、健怡可乐、雪碧、芬达和可口可乐的其他产品供世界各地的人们享用。这个公司有着世界上最大的软饮料生产和销售系统,其销售值比世界第二大软饮料公司的销售多1倍。可口可乐产品在世界上200多个国家都有销售。
有几个原因使这家公司相信,他们的产品会变得越来越国际化。一个原因是世界可支配收入在增加,另一个是在美国和欧洲以外的其他地区,人口正趋于年轻化。此外,随着政治障碍的消除和交通困难的解决,进入国际市场变得越来越容易。另外,还有一个原因是全球共同的观念,习惯和兴趣创造了市场机会。公司任务的一部分就是使可口可乐保持世界最具有仅仅是的商标的地位,并充分利用这个世界上最有效的、分布最大的销售系统。
在1999年6月,可口可乐公司在俄罗斯的Volgograd引入了200mL(大约6.8盎司)装的可乐瓶,发动了面向贫穷的消费者的销售攻势。这个策略在其他国家,如印度是很成功的。这样的可乐一瓶卖12美分,几乎人人都买得起。
【讨论】
1.因为瓶装机械的不稳定,所以很可能每瓶装的都不一定恰好是200mL。有的多些,有的少些。因为200mL的容量有些随机,一个生产工程师想从第一批产品中抽出一些进行检验,以确定它们是否很接近200mL的标定容量。假设下面的数据是从50瓶样本中得出的容量数值。请用本章介绍的方法来描述此样本(要考虑中心趋势测度值、方差和偏度)。在这个分析之上,讨论装瓶过程的工作情况(计量单位:盎司)。
6.1 5.9 6.2 6.2 6.0 6.1 6.9 6.1 6.3 6.5
5.7 6.4 6.3 5.8 5.3 6.1 5.4 5.6 5.2 6.2
6.4 5.8 5.9 6.2 5.6 5.6 6.4 6.4 6.6 6.6
6.1 6.8 5.9 6.0 5.9 6.3 6.5 5.9 7.1 5.7
6.2 6.5 6.2 5.7 6.9 6.2 5.5 6.6 6.3 5.8
2.根据以上数据,应用Excel输出“描述统计”结果,并给管理员写一个简短的分析报告。(www.xing528.com)
【思考与练习】
一、思考题
1.什么叫集中趋势?测度集中趋势常用指标有哪些?
2.均值、众数和中位数有何关系?
3.什么叫离散趋势?测度离散趋势常用指标有哪些?
4.为什么要计算离散系数?
二、练习题
1.随机抽取30个网络用户,得到他们的年龄数据见表4.11。
表4.11 年龄数据/周岁
(1)计算众数、中位数。
(2)根据定义公式计算四分位数。
(3)计算平均数和标准差。
(4)计算偏态系数和峰态系数。
(5)对网民年龄的分布特征进行综合分析。
2.某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2min,标准差为1.97min,第二种排队方式的等待时间见表4.12。
表4.12 等待时间/min
(1)画出第二种排队方式等待时间的茎叶图。
(2)计算第二种排队方式等待时间的平均数和标准差。
(3)比较两种排队方式等待时间的离散程度。
(4)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
3.某百货公司6月份各天的销售额数据见表4.13。
表4.13 销售额数据/万元
(1)计算该百货公司日销售额的均值、中位数。
(2)计算日销售额的标准差。
4.一条成品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。表4.14是一周内各天的产量,该生产线哪几天失去了控制?
表4.14 一周内各天的产品/件
5.对10名成年人和10名幼儿的身高进行抽样调查,结果见表4.15。
表4.15 身高抽样调查结果/cm
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?
(2)比较分析哪一组的身高差异大。
【注释】
[1]《剑桥当代商务决策分析》系列丛书之一《定量决策分析》扉页。
[2]大卫·R.安德森,等.商务与经济统计学精要[M].陆成来,等,译.大连:东北财经大学出版社,汤姆森国际出版集团,2000:67.
[3]肯·布莱克,等.以Excel为决策工具的商务与经济统计[M].张久琴,等,译.北京:机械工业出版社,2003:71.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。