首页 理论教育 SAS基础:了解TABULATE过程

SAS基础:了解TABULATE过程

时间:2023-08-10 理论教育 版权反馈
【摘要】:除非另外声明,本章6.2节制表的数据都取自表6-3。SAS把地区、性别和班级这样的变量称为“分类变量”。连续变量是被统计的对象,这儿要考虑分类变量对它们的影响。一般形式是当table语句中只有1个分类变量时,tabulate过程指示SAS以变量1为横轴打印一维表。为了使编程方便,对于表6-2的数据,设变量地区、班级、性别分别记为area、team、gender。

SAS基础:了解TABULATE过程

首先看一个例子。

设某人抽查某学院40名学生(实际统计人数很多,上千人,为了说明tabalate过程的使用,我们这儿仅选用40人),统计他们的身高和体重,用于分析学生身高和体重的规律。40名学生来自4个教学班,3个地区(家庭所在地区)。具体数据如表6-3所示。要求打印数表,直观地比较地区(学生来自地区)、性别对身高和体重的影响。除非另外声明,本章6.2节制表的数据都取自表6-3。

表6-3 40名学生的身高和体重情况(性别取1代表男性,取2代表女性)

续表6-3

该统计数据中有两类变量:身高和体重是连续变量因变量),而变量地区、性别和班级只能取有限个值,用来把数据集highweig分类,地区的值(地区1—地区3)把数据集分成三类,性别的值(男和女)把数据集分成两类,班级的值(1班—4班)把数据集分成四类。SAS把地区、性别和班级这样的变量称为“分类变量”。连续变量(身高和体重)是被统计的对象,这儿要考虑分类变量对它们的影响。变量编号无用处。tabulate过程能由这些数据打出数表,由这些表可以直观地看出身高和体重(平均值)受地区和性别影响的情况。有些其他SAS过程,例如anova过程和glm过程,也可以用来细致精确地分析分类变量对连续变量(因变量)的影响,但是它们所用的统计工具复杂,并且不如tabulate过程打印的表直观,本书姐妹篇中将向向大家介绍GLM过程如何分析分类变量的影响。

一般情形下,tabulate过程有4条必要语句:proc tabulate语句、class语句、var语句和table语句。它们的最基本功能和最简形式如下。

(1)proc tabulate语句:用于调用tabulate过程。最简形式是

(2)class语句:用于说明哪些变量是分类变量。基本形式是(www.xing528.com)

说明变量1,变量2……是分类变量。

(3)var语句:用于说明哪些变量是连续因变量。基本形式是

说明变量1,变量2……是连续因变量。

(4)table语句:用于指示SAS输出表格。一般形式是

当table语句中只有1个分类变量时,tabulate过程指示SAS以变量1为横轴打印一维表(见例6.2)。当table语句中有2个分类变量时,tabulate过程指示SAS以变量2为纵轴,变量1为横轴打印二维表(见例6.3)。当table语句有3个分类变量时,tabulate过程指示SAS对于变量1的每一个值打1张表:变量2的值作为纵轴,变量3的值作为横轴(见例6.4)。table语句常用选项如下:all(通常跟在分类变量之后)指示SAS对该变量增加页、行或列,在该页、行或列输出观测值汇总的相应数据;mean指示表中输出被统计的连续变量(因变量)的均值;sum指示表中输出被统计的连续变量(因变量)的和;min指示表中输出被统计的连续变量(因变量)的最小值;MAX指示表中输出被统计的连续变量(因变量)的最大值。

为了使编程方便,对于表6-2的数据,设变量地区、班级、性别分别记为area、team、gender。设变量area的值分别是area1、area2、area3,变量team的值分别是team1、team2、team3、team4,变量gender的值是1(男性)和2(女性)。

table语句中对于不同选项或变量的并行用空格分开表示,例如既要打印出原有变量area的每个值来计算连续变量(因变量)的统计量外,还要输出area的所有值来计算连续变量(因变量)的统计量,那么可用代码“area all”;又如要把连续变量high和weight的统计表合在一起,那么可用代码“high weight”。如果要做分类变量、因变量和选项的“交叉”,则可以用“*”隔开,例如要对分类变量变量1的每一个值求变量high的均值,那么可以用代码“mean*high*变量1”;又如要对分类变量变量2的每一个值求变量high的均值、最小值和最大值,那么可以用代码“(mean min max)*high*变量2”。同一tabulate过程可以有多个table语句,指示SAS打印多张不同表。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈