上面Excel进行方差分析的结果作出了拒绝原假设的决策,这表明因素(自变量)与观测值(因变量)之间有关系。假如想进一步度量它们之间的关系程度怎样?自变量对因变量的影响效应到底多大?这些问题就需进行关系强度的测量。
回到误差平方和的来源:组间平方和(SSA)反映的是各总体样本均值之间的差异程度,即度量了自变量(颜色)对因变量(饮料销量)的影响效应。因此,只要组间平方和SSA不等于0,就表明两个变量之间有关系,但是关系大到一定程度才能作出是否显著的判断。当组间平方和比组内平方和(SSE)大,而且大到一定程度时,就意味着两个变量之间的关系显著,数值越大,表明两变量之间的关系就越强;反之,就意味着两个变量之间的关系不显著,数值越小,表明它们之间的关系就越弱。
这里测度自变量和因变量之间关系强度的指标就比较明显了,应用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映。将自变量平方和占总平方和的比例记为R2,为了与第8章的定义统一,可将其称为判定系数,即判定系数
其平方根R定义为相关系数,是用来测度两个变量之间关系强度的指标。
例7.1中,计算的结果为(www.xing528.com)
其平方根相关系数R=0.505029。
上述计算结果可得出以下结论:颜色(自变量)对饮料销量(因变量)的影响效应占总效应的25.5054%,而残差效应则占74.4946%。即颜色对饮料销量差异解释的比例达到近26%,而其他因素(残差变量)所解释的比例近为74%以上。尽管判定系数R2并不高,但颜色对饮料销量的影响已经达到统计上显著的程度。上述计算结果中判定系数R2的平方根(与第8章中介绍的相关系数r一致)R=0.505029,表明颜色和饮料销量之间有中等的相关关系。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。