多元统计分析中的F检验及其实现

更新时间：2025-01-18 工作计划版权反馈

【摘要】：方差分析，由英国统计学家R.A.Fisher在1923年提出，为纪念Fisher，以F命名，故方差分析又称F检验，常用于两个及两个以上样本均数差别的显著性检验。基于以上假定条件，方差分析才能将方差的差异性推断转换成对两个以上总体均值的差异性推断。方差分析能够一次性比较两个及两个以上的总体均值，看它们之间是否有显著性差异。用方差分析比较多个样本均数，可有效地控制第一类错误。

方差分析（analysis of variance，ANOVA），由英国统计学家R.A.Fisher在1923年提出，为纪念Fisher，以F命名，故方差分析又称F检验，常用于两个及两个以上样本均数差别的显著性检验。方差分析的基本思想是：根据资料设计的类型及研究目的，将总变异分解为两个或多个部分，每个部分的变异可由某因素的作用来解释。通过分析研究中不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小（孙振球，2014）。

方差分析的应用条件为：各样本须是相互独立的随机样本；各样本来自正态分布总体；各总体方差相等，即满足方差齐性。还需假定每一个观察值都由若干部分累加而成，即总的效果可分成若干部分，而每一部分都有一个特定的含义，称之为效应的可加性。基于以上假定条件，方差分析才能将方差的差异性推断转换成对两个以上总体均值的差异性推断。方差分析的思想逻辑为：将全部观测值的总变异按影响结果的诸因素分解为相应的若干部分变异，构造出反映各部分变异作用的统计量，在此基础上，构建假设检验统计量F值，以实现对总体均数是否有差别的推断。

下面以单因素方差分析为例，介绍方差分析原理：

将N个实验对象（对人称受试对象）随机分为g（g≥2）组，分别接受不同的处理，第g组的样本含量为ni，第i（i＝1，2，…，g）处理组的第j（j＝1，2，…，ni）个测量值用Xij表示。方差分析的目的就是在零假设H0：μ1＝μ2＝…＝μk成立的条件下，通过分析各处理组均数之间的差别大小，推断g个总体均数间有无差别，从而说明处理因素的效果是否存在。

归纳整理数据的格式和符号，如表2-1所示。

表2-1　g个处理组的试验结果

pagenumber_ebook=23,pagenumber_book=11

记总均数各处理组均数为 pagenumber_ebook=23,pagenumber_book=11 ，总例数为N＝n1＋n2＋…＋ng，g为处理组数。

实验数据有三种不同的变异：总变异、组间变异和组内变并（孙振球，2014）。

（1）总变异：全部测量值大小不同，这种变异称为总变异。总变异的大小可以用离均差平方和（sum of squares of deviations from mean，SS）表示，即各变量值与总均数差值的平方和，记为SS总。总变异SS总反映了所有测量值之间总的变异程度。离均差平方和及自由度分别表示如下：

pagenumber_ebook=23,pagenumber_book=11

其中　 pagenumber_ebook=23,pagenumber_book=11

（2）组间变异：各处理组由于接受处理的水平不同，各组的样本均数（i＝1，2，…，g）也大小不等，这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示，记为SS组间。

pagenumber_ebook=23,pagenumber_book=11

υ组间＝g－1

（3）组内变异：在同一处理组中，虽然每个受试对象接受的处理相同，但测量值仍各不相同，这种变异称为组内变异（误差）。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示，记为SS组内，其表示随机误差的影响。

pagenumber_ebook=23,pagenumber_book=11 (www.xing528.com)

υ组内＝N－g

三种变异的关系如下：

总离均差平方和分解为组间离均差平方和与组内离均差平方和。

相应地，总自由度分解为组间自由度和组内自由度。

变异程度除与离均差平方和的大小有关外，还与其自由度有关，由于各部分自由度不相等，因此各部分离均差平方和不能直接比较，须将各部分离均差平方和除以相应的自由度，其比值称为均方差，简称均方（mean square，MS）。组间均方和组内均方的计算公式为：

pagenumber_ebook=24,pagenumber_book=12

组内均方和组间均方的比值称为F统计量，即：

pagenumber_ebook=24,pagenumber_book=12

F值的分布服从F分布，所以F值在F分布上有对应的显著概率p值。当p值大于假设检验的显著性水平时，说明组间方差和组内方差没有显著性差异，也就是说因素的不同水平对于数据总体没有影响；反之，当p值小于假设检验的显著性水平，说明因素的不同水平对于数据总体有影响。

最基础的完全随机设计资料的变异分解如表2-2所示。

表2-2　单因素完全随机设计方差分析表

pagenumber_ebook=24,pagenumber_book=12

从上面可以看出方差分析的基本思想是根据研究的目的和设计类型，将总变异SS总及其自由度v分别分解成相应的若干部分，然后求各相应部分的变异。再用各部分的变异与组内变异进行比较，得出统计量F值。最后根据F值的大小确定p值，作出统计推断（孙振球，2014）。

方差分析能够一次性比较两个及两个以上的总体均值，看它们之间是否有显著性差异。t检验和u检验虽然适用于两个样本均数的比较，但对于多个样本均数的比较，如果仍用t检验或u检验，犯第一类错误的概率就会增加。因而t检验和u检验并不适用于多个样本均数的比较。用方差分析比较多个样本均数，可有效地控制第一类错误。常用的方差分析方法包括：单因素方差分析、多因素方差分析、多元方差分析、协方差分析、重复测量方差分析，这几种方法将在后几节中详细介绍。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作思路

策划书

留守儿童

关工委

内部审计

爱国卫生

业务员

信息技术

教研员

心理教育

居委会

社区学校

公司安全

部门月度

区安全

公司工会

乡镇基层

劳动保障

经理年度

内科年度

教学个人

前台个人

个人月度

配班个人

多元统计分析中的F检验及其实现

相关推荐

多元统计分析中的F检验及其实现

有关多元统计分析与ＳＡＳ实现的文章

相关推荐