首页 理论教育 总体均值的检验方法及优化建议

总体均值的检验方法及优化建议

时间:2023-07-03 理论教育 版权反馈
【摘要】:将样本均值经标准化后,即可得到检验统计量。设假设的总体均值为μ0,当总体方差σ2已知时,总体均值检验的统计量为当总体方差未知时,可用样本方差近似代替总体方差。图6.4例6.4中的拒绝域此题中的假设检验也可用p值来进行检验。图6.8原始数据的p值计算过程此时给出的分布左侧面积为0.566027564,用1减去该数值,就得到单侧检验的p值,即p值=1-0.566027564=0.433972。因此为单侧检验问题,且属于右侧检验。

总体均值的检验方法及优化建议

在对总体均值进行检验时,按照检验的步骤,关键是根据样本的抽样分布选择合适的检验统计量,而检验统计量取决于抽取的样本是大样本(n≥30)还是小样本(n<30),此外,还需要区分总体是否服从正态分布、总体方差是否已知等几种情况。下面分别讨论。

1)大样本的检验方法

根据第5章抽样分布的知识,在大样本情况下,样本均值抽样分布近似服从正态分布,

当总体方差未知时,可用样本方差近似代替总体方差。此时,总体均值检验的统计量为

【例6.4】 一种零件的直径为15cm,标准差是0.963cm,为了对生产的质量进行检查,质检人员在某批零件中随机抽查100个零件进行检验,测得零件的平均直径为15.28cm,取显著性水平α=0.05,这批零件是否符合生产要求?

解 根据题意,生产出的零件直径大于或小于15cm都不符合要求,因此属于双侧检验问题,提出的原假设和备择假设为

H0:μ=15;H1:μ≠15

当总体方差已知时,根据式(6.2)计算检验统计量的具体数值为

检验统计量的含义是:样本均值与总体均值相比,相差2.9076个抽样标准差。

根据给定的显著性水平α=0.05,查阅标准正态分布表得zα/2=z0.025=1.96,由于z=2.9076>1.96,因此,拒绝原假设。检验结果表明,样本数据提供的证据不支持原假设,故拒绝原假设,表明这批零件不符合生产要求。上面的决策过程如图6.4所示。

图6.4 例6.4中的拒绝域

此题中的假设检验也可用p值来进行检验。p值可用Excel中的统计函数功能来计算。其具体操作的步骤如下:

用Excel计算正态分布p值的操作步骤:

第1步:进入Excel表格界面,选择“插入”菜单,直接单击“fx”(插入函数)命令。

第2步:在出现的“插入函数”对话框中,在函数类别中单击“统计”,并在函数名菜单下选择“NORMSDIST”,然后单击“确定”按钮。此时,出现的界面如图6.5所示。

第3步:将z的绝对值2.9076录入,得到的函数值为0.998178931,如图6.6所示。该值表示的是在标准正态分布条件下,z值左边的面积为0.998178931。

第4步:z=209076右边和z=-2.9076左边的面积是一样的,所以双侧检验的p值为

p=2×(1-0.998178931)=0.003642

由于计算出的p值小于0.05,因此拒绝原假设。

图6.5 计算p值的操作过程

图6.6 统计量的函数参数

图6.7给出了p值的示意图

图6.7 标准正态分布Z值示意图

由于p值=0.003642远远小于显著性水平α=0.05,因此拒绝原假设H0,得到的结论与前面相同。

【例6.5】 一家食品加工厂每天的产量大约为23500袋,按规定每袋的质量为50g。为对产品质量进行检验,质检部门某天随机抽取了50袋食品,测得每袋质量见表6.3。

表6.3 50袋食品的质量/g

利用这个样本数据,检验每袋食品的质量是否低于标准质量?(α=0.05)

解 本题关心的是样本中食品的质量是否低于标准质量50g,也就意味着μ是否小于50g,为单侧检验,且属于左单侧检验。提出的假设为

H0:μ≥50;H1:μ<50

根据样本数据,计算得出

由于总体方差未知,根据式(6.3)具体计算检验统计量数值为

该检验统计量的数值表示:样本均值与假设的总体均值相差-0.16627个抽样标准差。

根据给出的显著性水平α=0.05,可知,zα=z0.05=-1.645,由于检验统计量z=-0.16627>-1.645,所以不拒绝原假设。假设检验的结果表明,样本中每袋食品的质量不低于标准质量。

本题也可用p值进行检验,当使用统计量计算p值时,与上一例题给出的步骤一致。直接输入-0.16627,就可得出p值为0.433972(因为该命令给出的是分布的左侧的面积,恰好就是p值。若输入的是0.16627的话,给出的左侧面积是0.566028,这时p值=1-0.566028=0.433972)。

也可直接使用原始数据在Excel里进行p值检验,具体的操作步骤如下:

用Excel计算正态分布p值的操作步骤:

第1步:在Excel界面中,选择“插入”菜单,选择函数“fx”选项。

第2步:在函数分类中单击“统计”,并在函数名菜单下选择“ZTEST”,然后单击“确定”按钮。

第3步:在出现的对话框中,在“Array”设置框中,输入原始数据所在的区域,在“X”设置框中输入参数的某一假定值,在这里输入50,在“Sigma”设置框中输入已知的总体标准差(如果总体标准差未知,系统会自动使用样本标准差来代替),如图6.8所示。

图6.8 原始数据的p值计算过程

此时给出的分布左侧面积为0.566027564,用1减去该数值,就得到单侧检验的p值,即p值=1-0.566027564=0.433972。由于p值大于给定显著性水平0.05,所以不拒绝原假设,结论与统计量检验一致。

上面的决策过程如图6.9所示。

图6.9 例6.5中的拒绝域和p值

【例6.6】 某商场销售某商品,执行原销售方案平均每天销售量服从均值μ=75,方差σ2=14的正态分布。销售方案更新后,为了考察销售量是否提高,随机抽查了30天的销售量,求得平均销售量为77,假定方差不变,问在显著性水平0.05下,销售方案更新后平均每天销售量是否有显著提高?

解 该商场自然希望销售方案更新后销量能提高,因而也就想搜集证据支持“销售方案更新后销量有显著提高”的假设,也就是μ>75。因此为单侧检验问题,且属于右侧检验。提出的假设为

H0:μ≤75;H1:μ>75

根据式(6.2),计算检验统计量的具体数值为

根据给定的显著性水平α=0.05,查标准正态分布表得zα=z0.05=1.645。由于z=2.93>z0.05=1.645,所以拒绝原假设。检验结果表明,样本提供的信息证明销售方案更新后的销量有显著提高。

计算p值为0.0017<α=0.05,同样拒绝原假设。

上面的决策过程如图6.10所示。

图6.10 例6.6中的拒绝域和p值

通过以上三个例题介绍了一个总体均值的检验方法与步骤,这些方法与步骤为以后介绍的其他检验普遍适用,是学习假设检验思想与方法的基础,一定要很好地掌握。下面对大样本总体均值的检验问题作一总结,见表6.4。

表6.4 大样本情况下一个总体均值的检验方法(www.xing528.com)

2)小样本的检验方法

在小样本(n<30)情形下,检验统计量的选择与总体是否服从正态分布、总体方差是否已知有着密切联系。本节的内容都是首先以总体服从正态分布为假定前提,然后再依据总体方差是否已知来选择合适的检验统计量。[2]

当总体方差σ2已知时,即使是小样本,检验统计量式(6.2)仍然服从标准正态分布,要按式(6.2)给出的检验统计量对总体均值进行检验,检验的程序与大样本完全相同,不再赘述。这里郑重介绍小样本情形下,总体方差未知时总体均值的检验方法。

对于小样本,当总体方差σ2未知时,需要用样本方差s2代替总体σ2方差,此时式(6.2)给出的检验统计量不再服从标准正态分布,而是服从自由度为n-1的t分布。因此,需要采用t分布来检验总体均值,通常称为“t检验”。

检验统计量为

表6.5总结了小样本时总体均值的检验方法。

表6.5 小样本情况下一个总体均值的检验方法

【例6.7】 由于信息网络的飞速发展,很多人都直接从网上阅读或获得各种重要信息,一个研究机构据调查显示,目前人们每天阅读报纸杂志的平均时间仅为1.35h,为了验证这一说法是否正确,一家报刊机构为了调查人们每天花多少时间在阅读报刊上,抽取了由28个人组成的一个随机样本,他们每天看报纸或杂志的时间见表6.6。假设每天看报或杂志的时间服从正态分布,在0.05的显著性水平下,检验每天阅读报纸杂志的平均时间是否为1.39h?

表6.6 每天阅读报刊的时间/h

解 根据题意建立以下的原假设和备择假设:

H0:μ=1.35;H1:μ≠1.35

由表6.6中的样本数据得

由于样本容量为28<30,属于小样本,且总体方差未知,故样本分布为t分布采用式(6.4)计算统计量

根据自由度n-1=28-1=27,查t分布表得

tα/2(n-1)=t0.025(27)=2.052

由于t=0.86863<2.052,所以不拒绝原假设,样本提供的证据还不足以推翻原假设。

另外,t检验的p值同样可用Excel计算,具体操作步骤如下:

用Excel计算t分布p值的操作步骤:

第1步:进入Excel表格界面,直接单击“f(x)”(粘贴函数)命令。

第2步:在函数分类中单击“统计”,并在函数名菜单下选择字符“TDIST”,然后单击“确定”按钮。

第3步:在出现对话框的“X”栏中输入计算出的t的绝对值(如本题为0.86863),在“Deg⁃freedom”(自由度)栏中输入本例的自由度“27”;在“Tails”栏中输入“2”(表明是双侧检验,如果是单测检验,则在该栏输入“1”)。

第4步:“确定”输出p值=0.392705437(本例计算结果),如图6.11所示。

图6.11 t分布的p值计算

在图6.13中可以看出,p值=0.392705437>0.05,所以不拒绝原假设,得出的结论与计算统计量得出的结论是相同的。

上面决策过程如图6.12所示。

图6.12 例6.7中的t分布的拒绝域和p值

上面讨论了一个总体均值的检验问题,在实际应用中,首先需要弄清各种方法的适用场合。例如,是大样本还是小样本?总体是否服从正态分布?总体方差是否已知?对于无法确定总体是否服从正态分布的小样本情况,通过增加样本容量达到大样本标准(n>30),从而将小样本问题转换为大样本下的假设检验问题,当然这些不取决于实际条件是否允许。图6.13给出了一个总体均值检验的基本流程。

一个总体均值的假设检验是假设检验方法中最基本的问题,必须认真理解其中的基本思想与统计思维方式,既体现了总体参数检验中的基本理论,也是实际中应用最广泛的方法。

图6.13 一个总体均值假设检验的基本流程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈