结合上述例8.1,给出假设检验的一般步骤。 假设检验的基本步骤分5 步,这里给出的步骤更细一点。
(1)将实际问题提炼为统计问题
这是进行假设检验很重要的一步,也是关键的一步。 举个例子来说明,某工厂对产品生产线进行了技术改造。 生产线改造后与改造前有什么差异,首先就要搞清楚生产线改造后与改造前对比什么,是合格率提高了? 是加工精度提高了? 还是人力节省了? 是加工工时缩短了? 如果关注点是:生产线改造后与改造前,产能是不是提升了? 那么,实际问题就可以提炼成“改造后的每小时产出数是否高于改造前”这样一个统计问题。 如果关注点是:改造后比改造前,产能是不是提升了,产品质量是不是提高了? 那么,实际问题就可以提炼成“改造后的每小时产出数是否高于改进前,产品寿命是不是高于改造前”这样的统计问题。 此时,就需要提炼出多个统计问题。 每个统计问题所采用的推断方法可能不尽相同。
再举个例子,如果你是一名教师,最近改进教学方式方法(比如借助现代教育手段,开展了在线教学的尝试)。 如果你想知道,以前的教学方式与现在线上线下结合的教学方式,教学效果是否有明显提高。 这时你就要首先考虑如何对“教学效果”进行评价。 是由学生评价打分呢? 还是仅仅按照期末考试成绩来度量教学效果,然后通过分数看看学生对知识的接受程度呢? 不同的侧重点可以提炼出不同的统计问题。
(2)建立假设和显著性水平
进行假设检验需要建立一对相互对立的前提假设,即原假设H0 和备择假设H1。 通常将改变前后无区别的、不需证明的放在原假设,将有差别的、需要证明的放在备择假设。
在前例中,生产线改造前的均值和方差都是确定已知的了。 生产线改造后,待运行稳定抽样,这样可以建立的假设如下:
在介绍假设检验的基本原理的时候,曾说过:在一次随机抽样(试验)中,小概率事件是几乎不可能发生。 如果“在一次随机抽样(试验)中,小概率事件发生了”这就不合乎常理,就有理由拒绝接受原假设。 这里所谓的“不合乎常理”,并非逻辑上的相互矛盾,而是基于人们在实践中广泛采用的原则。 显然,小概率事件发生的概率越小,否定原假设就越有说服力。 这里的“小概率事件”究竟概率要“小”到什么程度才能算“小概率事件”呢? 在实际检验中,常常将这个“小概率”用α 来表示。 这个α 称为显著性水平。 显著性水平α,也是之前所陈述的犯第一类错误的风险。 根据经验往往对α 取较小的数值,大多数情况下取0.05,当然也有取0.1 或者0.01 的。
(3)确定检验统计量及拒绝域(www.xing528.com)
因为不同的检验方法是基于不同的前提假设而推导出来的。 因此,在假设检验的方法应用中,都会涉及一些前提条件,如随机抽样的概率分布等。 比如,在单样本z 检验中要求收集的数据要服从正态分布;在方差分析中要求每个样本都要服从正态分布,且要满足方差齐性即方差相等的要求;等等。 如果这些前提条件不能满足,则这个方法应用的效果就要大打折扣,这就是在每次检验时要验证前提条件的原因。
在确定了相应的检验方法后,就可以写出该检验方法对应的检验统计量及统计量的分布。 确定显著性水平后,即可以根据相应的检验统计量计算出拒绝域。
所谓的拒绝域,就是根据原假设和相应的统计量计算得出的统计量应该落入的一个区域范围。 将一次随机抽样中的样本观测值,代入相应的统计量,计算出的统计量数值落在这个区域时,就可以拒绝原假设。 由此可知,拒绝域代表的是样本远离原假设的程度。 不同的统计量,不同的检验方式(单侧检验还是双侧检验),对应的拒绝域不同。 关于拒绝域后面会另行介绍。
(4)根据样本计算检验统计量的值并进行判断
确定了拒绝域,下面就是根据样本计算检验统计量的值,如果这个值落在拒绝域中,则拒绝原假设,接受备择假设;如果没有落在拒绝域,就说明拒绝原假设的证据还不够充分,但尽量不要说接受原假设。
另外一种判断方法是计算p 值,即备择假设远离原假设的概率,p 值计算相对烦琐。但现在相关统计软件已经非常普及,统计软件中往往可以直接得到p 值。 举例来说,如果原假设是μ=10,备择假设是μ>10,抽样计算出的样本均值是10.5,则p 值就是μ≥10.5的概率;如果备择假设是μ<10,则p 值就是μ≤10.5 的概率。 将这个p 值与α 进行比较,如果p<α 则说明样本均值离原假设比较远,可以拒绝原假设;如果p>α,则说明没有足够的证据证明原假设不成立,所以无法拒绝原假设。
(5)将统计判断结果转换成实际结果
最后一步,要把统计上得出的结论转换为实际的结论,并据此作出相应的决策。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。