其中,是数据的总平均。SST反映了全部试验数据之间的离散程度,称之为总离差平方和或总离差。
即水平Ai下的样本平均值。则
易知上述第三项等于零,于是可将SST分解成
其中,
SSA的各项表示Ai水平下的样本均值与数据总平均的差异,这种差异是由水平Ai引起的,因而SSA的大小反映了因素A对试验结果的影响程度,SSA越大,表明因素A的影响程度越大,SSA叫作因素A的效应平方和,亦称组间平方和;SSE的各项(xij-)2表示在水平Ai下样本观察值与第i组样本均值的差异,这是由随机因素所引起的,SSE越大,表明随机因素的影响程度越大,SSE叫作误差平方和,亦称组内平方和。显然,SSA相对于SSE越大,也就是说比值越大,因素A的影响越显著;反之,因素A的影响被淹没在随机因素的影响之中,即因素A的影响不显著。那么,究竟比值多大时,才能说明因素A的影响显著呢?为此需要知道在原假设H0成立时比值的分布。可以证明,当原假设H0成立时,比值服从自由度为(p-1,p(n-1))的F分布。
由于和表达的含义相同,且为了直接利用我们熟知的F分布,可以建立下面的检验统计量:
其中,,p-1是SSA的自由度,p(n-1)是SSE的自由度。
通过以上分析可见:当F值较大时,表明因素A对试验结果的影响显著;反之,影响不显著。给定显著性水平α,查F分位数表得分位数F1-α(p-1,p(n-1))。当F>F1-α(p-1,p(n-1))时,拒绝H0,认为因素A对试验结果有显著影响;反之,当F<F1-α(p-1,p(n-1))时,不能否定H0,即认为因素A对试验结果无显著影响,或者更确切地说,就现有观察数据而言,还不能看出因素A的影响。为简便起见,将上述分析列成方差分析表,如表5.1.5所示。
表5.1.5 单因素试验方差分析表
(www.xing528.com)
在实际中,可按如下简便公式来计算SST、SSA、SSE:
则有
例5.1.4 利用表5.1.1中的数据,检验反应时间对产出率是否有显著影响,并指出反应时间取何水平时,产出率最高,已知α=0.05。
解 本例中,p=3,n=5,经计算得
于是得方差分析表5.1.6。
表5.1.6 反应时间对产出率方差分析表
因F0.95(2,12)=3.89<27.694 9,故在水平0.05下拒绝H0,认为不同反应时间下的产出率存在显著差异。由于当反应时间为60 min、70 min、80 min时,其产出率的平均值分别是73.8、84.8、76.6,因此,认为当反应时间为70 min时,产出率最高。不过,值得注意的是,若反应时间取水平65 min、70 min、75 min,即水平之间差距变小时,这三个反应时间下的产出率可能不存在显著差异,且70 min也不一定就是最好。由此可见,因素对试验结果是否存在显著影响是就其所取水平而言的。
注意:以上都是在针对每个因素等重复试验条件下进行讨论的,不过在不等重复试验条件下,即对应于各水平下的试验次数不全相同(如例5.1.2),可作相似的讨论,只不过计算公式稍微复杂一点而已。
基于R的求解方法之一如下:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。