首页 理论教育 试验设计与统计分析:项目一统计假设检验概述

试验设计与统计分析:项目一统计假设检验概述

时间:2023-09-26 理论教育 版权反馈
【摘要】:统计假设往往是根据研究假设提出的,描述了根据研究假设进行试验结果的两种统计选择。所以需要利用假设检验的方法达到由样本推断总体的目的。例如,对总体均值μ可以提出三个假设检验如下所述。从无效假设H0出发,根据所得检验统计量的抽样分布,计算表面效应仅由误差造成的概率。

试验设计与统计分析:项目一统计假设检验概述

一、统计假设的涵义

统计学上,假设(hypothesis)指关于总体的某些未知或不完全知道性质的待证明的声明(assertion)。假设可分为两类,即研究假设(research hypothesis)和统计假设(statistical hypothesis)。研究假设是研究人员根据以前的研究结果、科学文献或者经验而提出的假设。统计假设往往是根据研究假设提出的,描述了根据研究假设进行试验结果的两种统计选择。

统计假设有两种,分别为原假设(null hypothesis,H0;或称零假设、虚假设、无效假设)和备择假设(alternative hypothesis,HA;或称对立假设)。原假设通常为不变情况的假设。比如,H0声明两个群体某些性状间没有差异,即两个群体的平均数和方差相同。备择假设,HA,则通常声明一种改变的状态,如两个群体间存在差异。研究假设可以为两种可能之一,即没有差异和有差异。通常情况下,备择假设和研究假设相同,因此,原假设与研究者的期望相反。一般地,证明一个假设是错误的较正确的容易,因此,研究者通常试图拒绝原假设。

假设检验的定义为:假定原假设正确,检验某个样本是否来自某个总体,它可以使研究者把根据样本得出的结果推广到总体。根据样本进行的假设检验有两种结果:①拒绝H0,因为发现其是错误的;②不能拒绝H0,因为没有足够的证据拒绝它。原假设和备择假设总是互斥的,而且包括了所有的可能,因此,拒绝H0则HA正确。另一方面,证明原假设H0是正确的比较困难。

根据概率理论和理论分布的特性进行假设检验,概率理论用来拒绝或接受某个假设。因为结果是从样本而不是整个总体得出的,因此,结果不是100%正确。

二、假设检验的基本原理

实际中,多数情况是用样本数据去推断总体,由于个体变异和随机抽样误差,不能简单地根据样本统计量数值的大小直接获得结论。例如,比较甲、乙两种食品包装的受欢迎程度,甲种包装的食品购买量为200袋,乙种包装的食品购买量为300袋,并不能说明乙包装更受欢迎,因为如果再重新做一次试验其结果可能相反。所以需要利用假设检验的方法达到由样本推断总体的目的。

假设检验的理论依据是“小概率事件原理”,在上例对H0作出的判断中,实际上运用了小概率原理。所谓小概率原理,就是认为小概率事件在一次试验(观察)中实际上不会发生。在统计推断中,把概率很小的事件叫做小概率事件。“小概率事件原理”就是概率很小的事件在一次试验中认为是不可能发生的。如果预先的假设使得小概率事件发生了,类似于数学中传统推理反证法出现逻辑矛盾那样,就认为出现了不合理现象,从而拒绝假设。一般把概率不超过0.10、0.05、0.01的事件当作“小概率事件”,用α表示,称为检验水准或显著水平(signifi-cance level),α通常取0.05、0.01,实际问题中也可取0.10、0.001等。

三、假设检验的步骤

第一步,建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA。H0与HA在假设检验问题中是两个对立的假设:H0成立则HA不成立,反之亦然。例如,对总体均值μ可以提出三个假设检验如下所述。

(1)H0μ=μ0,对HAμ≠μ0

(2)H0μ=μ0,对HAμμ0

(3)H0μ=μ0,对HAμμ0

(1)称为双尾或双侧检验,(2)和(3)称为单尾或单侧检验。

第二步,规定显著水平α。由于总是在有相当的根据后才作出原假设H0的,为此选取一个很小的正数α,如0.01或0.05。检验时,就是要解决当原假设H0成立时,做出不接受原假设H0的这一决定的概率不大于这个显著水平α

第三步,检验计算。从无效假设H0出发,根据所得检验统计量的抽样分布(不同的假设检验,所得统计量不同),计算表面效应仅由误差造成的概率。

第四步,统计推断。根据计算的概率值大小来推断无效假设是否错误,从而决定肯定还是否定H0

由于常用显著水平α有0.05和0.01,故做统计推断时就有3种可能结果,每次检验必须且只能得其中之一,具体如下所述。

①当计算出的概率P>0.05时,说明表面效应仅由误差造成的概率不是很小,故应接受无效假设H0,拒绝HA。此时称为差异不显著。

②当计算出的概率0.01<P≤0.05时,说明表面效应仅由误差造成的概率很小,故应否定无效假设H0,接受HA。此时的显著水平称为差异显著。差异显著通常是在计算的统计量值上用记“*”来表示。

③当计算出的概率P≤0.01时,说明表面效应仅由误差造成的概率更小,更应否定无效假设H0,接受HA。此时的显著水平称为差异极显著。差异极显著通常是在计算的统计量值上用记“**”来表示。

下面通过举例说明假设检验的基本原理和步骤。

【例5-1】某工厂生产的咀嚼片额定标准为8.9g/片,从机器所生产的产品中随机抽取9片,=9.0111,S=0.1182。该厂生产的咀嚼片是否符合标准?

第一步:建立统计假设。

样本的均数=9.0111与额定标准8.9g/片之间的差异由两种原因造成:一是机器工作不正常造成的,也称为本质原因,样本均数与总体均数有实质性差异;另一种是机器正常工作,样本均数与总体均数没有实质性差异,差异是由随机误差所造成的。统计上就是要根据样本的信息去推断究竟是哪种原因造成的。

先假设该厂生产的咀嚼片的质量(μ)符合标准μ0,即H0:μ=μ0,则HAμμ0

第二步:规定显著水平。

由附录3可知

公式说明|t|1.86是一个小概率事件,即|t|超过1.86的可能性是很小的。

第三步:检验计算。

根据抽样分布的理论,在此假设条件下,可以构造出一个统计量,公式如下

根据公式可知服从自由度为df=n-1=9-1=8的t分布。

第四步:统计推断。

|t|=2.82011.86,因此,P<0.05,显然是发生小概率事件,与“小概率事件原理”相违背。上面的推理是没有错误的,问题只能出在假设上,从而拒绝假设,可以认为该工厂生产的咀嚼片的质量不符合标准。

四、假设检验的两类错误

统计假设检验是根据小概率事件的实际不可能性原理来决定否定或接受无效假设的。因此在作出是否否定无效假设的统计推断时,没有100%的把握,总是要冒一定的下错误结论的风险。如表5-1所示为在一次统计假设检验中可能出现的4种情况。

在列出4种情况中,有两种情况的检验结果是错误的。其中,当H0本身正确,但通过假设检验后却否定了它,也就是将非真实差异错判为真实差异,这样的错误统计上称为第一类错误,亦称Ⅰ型错误(typeⅠerror)。反之,当H0本身错误时,通过假设检验后却接受了它,也即把真实差异错判为非真实差异,这样的错误叫做第二类错误,亦称Ⅱ型错误(typeⅡerror)。

表5-1 统计假设检验结果的4种情况

由表5-1所示的第三行可知,如果结论为否定H0,则可能得出正确结论,也可能犯概率为α的第一类错误。第四行可知,如果接受H0,则或者得出正确结论,或者犯概率为β的第二类错误。对于某一次检验,其结果是不是出错,一般无从知晓。但是可以肯定,否定无效假设H0时可能犯第一类错误,而接受无效假设时可能犯第二类错误,并且犯两类错误的概率有多大是可知的。(www.xing528.com)

犯第一类错误的概率通常不会超过显著水平α。因为在无效假设H0正确的情况下,从μ0总体中随机抽出的样本平均数仍有α大小的概率出现在否定域。然而在假设检验中,一旦落入否定域,就否定H0。因此,犯第一类错误的概率通常不会超过H0正确时出现在否定域的概率α,即显著水平。由此可见,当在显著水平α下做出否定H0的推断时,有1可靠性保证结论正确。同时要冒α这样大的下错误结论的风险。要使犯第一类错误的概率小一些,可将显著水平定得小一点。从以上例子可知,可以控制显著水平(第一类错误,α),那么为什么推荐的显著水平为0.05,而不是更低的第一类错误概率0.01或0.001呢?有时确实会选择较高的显著水平,但是这时,第二类错误β升高,检验功效下降。通过下面一个例子进行说明。

【例5-2】假设有一个总体服从正态分布,其平均数等于100,标准差等于10。另一个总体也服从正态分布,平均数等于105,标准差等于10。不知道样本是从哪一个总体抽取的,只知道为其中之一。而实际上,样本来自均值等于105的样本。

案例1:假定样本含量n=25,α=0.05。

假设为

H0μ=100,σ=10

HAμ=105,σ=10

首先计算当H0正确时,什么情况下会犯第一类错误。临界值μ0.05=1.645,注意这时为单尾检验,即

于是得=103.29。如果H0正确,当平均数大于103.29时,拒绝H0,第一类错误的概率为0.05。如果H0是错误的,平均数低于103.29会导致第二类错误,得出样本来自平均数为100总体的结论。如图5-1所示,平均数为100的分布的斜影部分为第一类错误,平均数为105的分布的阴影部分为第二类错误。现在可以根据定义,计算第二类错误

这时μ检验的检验功效等于1=1-0.1963=0.8037。

图5-1 第一类错误和第二类错误示意图

案例2:假定样本含量n=25,α=0.01。

同样的,先计算当H0正确,什么时候会犯第一类错误。与前面的相同,查附表3,统计数临界值μ0.01=2.330,即

于是得=104.66。因此,第二类错误为

这时μ检验的检验功效等于1=1-0.4325=0.5675。

表5-2所示为三种显著水平下第二类错误和检验功效;从中可以看出,随着显著性水平的提高,第二类错误增大,检验功效下降;这样的后果不是我们期望的。这种现象的根本原因,是因为两个样本分布存在重叠。比如,如果一个样本的均值等于100,而另一个为10000,由于两个样本分布没有重叠,第二类错误就消失了。

表5-2 显著水平和第二类错误、检验功效的关系

=0.001时,临界值μα=3.09。

案例3:假定样本含量n=100,α=0.05。

=101.645,于是,第二类错误为

检验功效等于0.9996。

样本含量提高后,样本平均数的标准误下降,使样本分布间的重叠减少,因此,可以通过样本含量来提高检验功效,降低第二类错误。

五、一尾检验与两尾检验

上述假设检验中,对应于无效假设H0μ=μ0的备择假设为HAμ≠μ0。它实际上包含了μ<μ0μ>μ0这两种情况,因而这种检验有两个否定域,分别位于分布曲线的两尾,故叫两尾检验(two-tailed test)。两尾检验的目的在于判断μμ0有无差异,而不考虑μμ0谁大谁小,把μ<μ0μ>μ0合为一种结果。这种检验中运用的显著水平α也被平分在两尾,各尾有α/2,称作两尾概率。

两尾检验在实践中被广泛应用。但是,在有些情况下两尾检验不一定符合实际情况。例如,某酿醋厂的企业标准规定曲种酿造醋的醋酸含量应保证在12%以上(μ0),若进行抽样检验,则抽出的样本平均数时,无论大多少,该批醋都应是合格产品。但时,却有可能是一批不合格产品。这类否定域位于分布曲线某一尾的统计假设检验称为一尾检验(one-tailed test)。应当注意的是,在实际检验中,为了构造检验统计量,一尾检验的无效假设仍采用H0μ=μ0

选用两尾检验还是一尾检验应根据专业的要求在试验设计时就确定。一般而论,若事先不知道μμ0谁大谁小,为了检验μμ0是否有差异,则用两尾检验;如果凭借一定的专业知识和经验,推测μ不会小于(或大于)μ0时,为了检验μ是否大于(或小于)μ0,应用一尾检验。

六、假设检验应注意的问题

1.注意统计显著和生物学重要性的区别

假设检验结果为差异显著,只是统计分析的结果,并不一定具有重要的生物学意义,也不表明差异非常大。假如两个奶牛群的305d产乳量平均数差异10kg,如果样本量足够大,进行假设检验结果可能会达到显著,但是,对于生产实际却没有任何价值。相反,如果两个蛋鸡群的平均蛋质量相差5g,假设检验结果可能不显著,但是,却可能有重要的经济价值。同样地,如果假设检验结果为差异不显著,不能理解为样本间没有差异,假设检验不显著可能是因为误差太大而掩盖了真正的差异,进一步精确的试验结果的假设检验可能会得出差异显著的结果。

2.注意假设检验结果的解读

根据表5-1,无论我们是拒绝H0还是拒绝HA,我们都有可能会犯错误。因此,我们的假设检验结果为P>0.05,不能说“证明(prove)”H0是正确的,因为证明的意思为100%正确,但我们可以说数据(data)“支持”(support)原假设;同理,如果P<0.05,我们可以说数据支持备择假设。

3.关于显著水平的选择

α值的下降,第二类错误上升,检验功效下降。一般地,取α=0.05比较合适。有时,犯I类错误有严重后果,而且由于某些研究的特点决定了容易犯I类错误,如遗传学中的QTL(数量性状座位)定位研究,需要利用较低的显著水平,这时可以根据研究中染色体的数量校正显著水平的大小;关于假设检验时α值的取值校正方法超出了本书的范围,读者可以参考有关的统计学专著。由于样本含量升高可以提高检验功效,因此,如果条件允许,试验设计时应该尽量使各组样本含量大一些。

4.单尾检测或双尾检测的选择

关于假设检验时是采用单尾检验还是双尾检验,要根据不同问题的要求和专业知识来决定,一般在试验设计时就已经确定。如果事先不知道假设检验的结果,分析的目的是处理间有无差异,则进行双尾检验;如果根据专业知识或前人的结果,A处理的平均数比B处理的平均数高(或相反),假设检验的目的是处理A的平均数是否高于处理B的平均数(或差),则进行单尾检验。由上可知,如果对同一资料同时进行双尾检验和单尾检验,假设检验的结果是不同的,即单尾检验在显著水平α时显著,相当于双尾检验的2α水平显著。双尾检验显著的,单尾检验结果一定显著;而单尾检验显著的,双尾检验结果不一定显著。

5.选择合适的检验统计数

假设检验时要根据样本分布理论选择合适的检验统计数,每种检验统计数都有其适用条件。从本章下面两节可以知道,单样本的假设检验有u检验和t检验之分,我们要注意应用的条件不同。

此外,“显著”针对的是样本而不是总体,我们只能说“样本A和样本B平均数间存在显著差异”,而不能说“总体A和总体B的平均数差异显著”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈