在SAS 系统中,一般利用PROC ANOVA 过程和PROC GLM 过程进行方差分析。
PROC ANOVA 过程只能用于平衡数据的方差分析(所谓平衡数据,指所有效应因子的交叉水平上的样本数相同,否则称为非平衡数据),它比PROC GLM 过程的运行速度要快,要求的存储空间也要小一些。
PROC GLM 过程可以用于平衡和非平衡数据的各种方差分析、协方差分析以及广义线性模型。GLM 模型用于资料的最小二乘分析(least square analysis),最小二乘分析是20 世纪30年代后逐渐发展起来的一种统计分析方法,该方法的分析模型灵活,可以消除次级样本含量不等对均数和方法的影响,因而适用于畜牧试验资料的分析,在计算平均数、方差分析和资料校正时都有广泛应用。
PROC ANOVA 过程和PROC GLM 过程语法说明:
①CLASS 语句:指定分类变量及模型中的效应因子变量。
②MODEL 语句:定义拟合模型,给出模型中的因变量和效应变量的模型结构,并通过特定的表达式规定自变量的作用方式,如果没有指定任何自变量,则模型中仅包含常数项,此时检验的内容是因变量的均数是否为零,MODEL 语句中指定的自变量必须是CLASS 语句中声明过的分类变量,ANOVA 过程不允许自变量中有连续型变量(数值变量),而因变量则必须是数值型变量。
③BY 语句:指定分组变量。(www.xing528.com)
④MEANS 语句:计算和比较均值,指令系统输出这个语句中给出的每一个效应变量各个水平对应的因变量的均值,或几个效应变量交叉水平对应的因变量的均值,并且可以检验比较各个水平对应的均值之间的两两差异。
⑤LSMEANS 语句:GLM 过程特有的语句,它的功能和MEANS 类似,指令输出这个语句中给出的每一个效应变量各个水平对应的因变量的均值,或几个效应变量交叉水平对应的因变量的均值,并且可以检验比较各个水平对应的均值之间的两两差异。但LSMEANS 语句输出的均值不是算术均值而是最小二乘均值。
⑥CONTRAST 语句:可以用自定义的方式进行假设检验,必须出现在MODEL 语句之后,如果用到MANOVA 语句、REPEATED 语句、RANDOM 语句或TEST 语句,CONTRAST 语句则必须出现在这些语句之前,标记用来识别所进行的检验,用以标识的文字或符号需要用单引号括起来,效应表达式用以指定假设检验的因素(组合),这些因素(组合)必须是MODEL 语句中出现过的,效应表达式后面的常数向量用以指定相应因素(组合)水平的值,在指定各水平的情况下进行相关因素的分析。
⑦ESTIMATE 语句:用于实现对线性方程的估计,它必须出现在MODEL 语句之后,使用规则和CONTRAST 语句基本相同,其中的语句元素的含义和用法也与CONTRAST 语句基本相同。
⑧TEST 语句:指定效应平方和及误差项,构建检验,进行裂区设计(系统分组)数据处理时需要。
⑨REPEATED 语句:指定模型中的重复测量因子(MODEL 语句中存在相同试验单位的重复测量的独立变量时),以检验相关因子效应。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。