首页 理论教育 [SAS基础] 使用tabulate打印高维度统计表

[SAS基础] 使用tabulate打印高维度统计表

时间:2023-08-10 理论教育 版权反馈
【摘要】:table语句是那么tabulate过程就对性别的每一种打印一张表,表中都以班级和地区分别为纵轴和横轴变量,没有符号all,不做汇总。因为性别只有两个值,tabulate过程输出两张表。表6-4各种土壤、耕作方式、肥料和品种搭配后的小麦产量解连续变量(因变量)是yield,分类变量是soil、farm、fertilizer和strain。

[SAS基础] 使用tabulate打印高维度统计表

当有3个分类变量影响连续变量因变量)时,可以在table语句中依次列出3个分类变量。这时tabulate过程对第一个分类变量的每一个值打出一张表,以另两个变量分别为横轴和纵轴制作二维表,这一系列二维表合起来形成三维表。以表6-3的身高数据为例,如果分类变量的顺序是性别(gender)、班级(team)和地区(area)。table语句是

那么tabulate过程就对性别的每一种打印一张表,表中都以班级和地区分别为纵轴和横轴变量,没有符号all,不做汇总。因为性别只有两个值,tabulate过程输出两张表。

例6.4 对于表6-3中的数据制作三维表,列出性别、班级、地区不同组合的情况下平均身高是多少。所有分类变量都要做汇总。

解 希望输出汇总,所以第一个变量也要与all并行。可用以下程序:

提交程序后得到3张表

gender 1

gender 2

all

所得第1张表(表头gender 1)是有关男生的表格,第2张表(表头gender 2)是有关女生的表格,第3张表(表头all)是男女生合在一起的表格。每张表以班级为纵轴,以地区为横轴,统计符合条件的学生的身高平均值。其中只有圆点的项表示没有数据可平均(没有符合条件的学生),例如4班男生中没有地区3的学生,2班女生中没有地区3的学生,3班女生中没有地区2的学生,4班女生中没有地区1的学生(这些因没有学生而无法平均的情况可以在例6.6中更清楚地看到)。

如果需要考虑4个或更多分类变量可以选定一个分类变量(例如例6.5中的strain)为横轴变量,另一个分类变量(例如例6.5中的fertilizer)为纵轴变量,其余变量排序后在tabulate语句中放在最前面,用“*”连接(见例6.5)。(www.xing528.com)

例6.5 在同样大的地块上对2种土壤(取值1,2)、2种耕作方式(取值1,2)、4种肥料(取值0,1,2,3)和3个小麦品种作144次实验。土壤、耕作方式、肥料和品种做各种搭配后进行种植实验,得到每小块土地的小麦产量如表6-4所示(数据体存于d:/wu/yield.txt)。试制作四维表列出各种搭配下的平均产量。

表6-4 各种土壤、耕作方式、肥料和品种搭配后的小麦产量

解 连续变量(因变量)是yield,分类变量是soil、farm、fertilizer和strain。采用如下程序:

提交程序后得到4张表,如下所示:

soil 1and farm 1

soil 1and farm 2

soil 2and farm 1

soil 2and farm 2

这4张表分别是土壤和耕作方式取(1,1),(1,2),(2,1),(2,2)的搭配时肥料和小麦品种的各种搭配下的平均小麦产量。

练习题 根据表6-3的数据制作三维表,显示学生体重在不同性别、地区、班级情况下的平均值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈