设因素A 有p 个水平A1,A2,…,Ap,在水平Ai(i=1,2,…,p)下进行了n(n>1)次独立试验,得到表9.1.5所示的试验结果。
表9.1.5
在表9.1.5中,xij表示因素A 取第i 个水平时所得的第j 个试验结果,xij不仅与因素A的第i个水平有关,还受随机因素的影响,因此可将它表示成
其中μi 表示在因素A 取第i 个水平下,没有随机因素干扰时本应得到的试验结果值,εij表示仅受随机因素影响的试验误差,它是一个随机变量。这样同一水平下的试验数据可以认为来自同一个总体,并假定这一总体服从正态分布,且对应于不同水平的正态总体,其方差是相同的。也就是说,对应于Ai 的总体服从正态分布N(μi,σ2),其中μi,σ2 均为常数,且各εij相互独立,这些εij是由生产或实验中无法控制的差异引起的。这样检验因素A 对试验结果的影响是否显著就转化为检验p 个正态总体的均值是否相等,即检验假设
因此,单因素方差分析就相当于多总体均值的假设检验。为便于讨论,尤其是为推广到多因素试验的方差分析打下基础,我们引入因素各水平的效应这一概念。
记μ=,称其为总平均。令αi=μi-μ(i=1,2,…,p),称αi 为水平Ai 的效应,则
显然αi 满足综合以上假定,可建立以下单因素方差分析模型:
于是检验H0:μ1=μ2=…=μp 等价于检验H0:α1=α2=…=αp=0。因此,单因素方差分析就是在模型(9.1.1)的假定下,检验假设
其中 是数据的总平均。ST 反映了全部试验数据之间的离散程度,称为总离差平方和或总离差。
记,表示水平Ai 下的样本平均值,则
可计算上式第三项等于零,因此可将ST 分解成
(www.xing528.com)
其中
SA 的各项表示在水平Ai 下的样本均值与数据总平均的差异,这种差异是由水平Ai 引起的,因此SA 的大小反映了因素A 对试验结果的影响程度,SA 越大表明因素A 的影响程度越大,SA 叫作因素A 的效应平方和,也称组间离差平方和。SE 的各项(xij-xi·)2 表示在水平Ai 下样本观察值与第i组样本均值的差异,这是由随机因素引起的,SE 越大表明随机因素的影响程度越大,SE 叫作误差平方和,也称组内离差平方和。显然,SA 相对于SE 越大,即越大,因素A 的影响越显著;反之,因素A 的影响被淹没在随机因素的影响之中,即因素A 的影响不显著。那么,究竟多大时,才能说明因素A 的影响显著呢? 为此需要知道在原假设H0 成立时的分布,但其分布不易求得,由于表达的含义相同,因此等价地考虑可以证明当原假设H0 成立时,服从自由度为(p-1,p(n-1))的F 分布。
建立如下检验统计量:
其中p-1是SA 的自由度,p(n-1)是SE 的自由度。
可以看出,当F 值较大时,因素A 对试验结果的影响显著;反之,影响不显著。给定显著性水平α,查F 分位数表得分位数Fα(p-1,p(n-1))。当F>Fα(p-1,p(n-1))时,拒绝H0,认为因素A 对试验结果有显著影响;当F<Fα(p-1,p(n-1))时,不能否定H0,即认为因素A 对试验结果无显著影响,或者更确切地说,就现有观察数据而言,还不能看出因素A 的影响。为简便起见,将上述分析列成方差分析表,如表9.1.6所示。
表9.1.6
在实际中,可按如下公式来计算ST,SA,SE,
则有
例9.1.5 利用表9.1.3中的数据,检验反应时间对产出率是否有显著影响,并指出反应时间取何水平时,产出率最高,已知α=0.05。
解 本例中,p=3,n=5,经计算得
于是得到表9.1.7所示的方差分析表。
表9.1.7
因F0.05(2,12)=3.89<27.6949,故在水平0.05下拒绝H0,认为不同反应时间下的产出率存在显著差异。由于当反应时间为60分、70分、80分时,其产出率的平均值分别是73.8%、84.8%、76.6%,因此,认为当反应时间为70分时,产出率最高。不过,值得注意的是,若反应时间取水平65分、70分、75分,即水平之间差距变小时,这3个反应时间下的产出率可能不存在显著差异,且70分也不一定最好。由此可见,因素对试验结果是否存在显著影响是就其所取水平而言的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。