SAS程序的基本用途是统计分析,而统计分析就应当对数据集作计算和分析,并通过图表等形式展示计算和分析的结论,像例1.1那样的没有数据集的情况是很少的。因此首先要把外部数据集转化成SAS数据集,或把数表输入成为SAS数据集,通常是变为临时数据集。如例2.2中,把表2-1变成数据集salary。构建SAS数据集就是本章的任务。SAS有多种手段来构建SAS数据集,特别是把外部数据文件变为SAS数据集,本章将介绍几种常用的构建SAS数据集的方法。
例2.2中使用data语句、input语句和datalines语句配合数据体产生SAS数据集;表编辑器也能通过键盘键入数据来形成SAS数据集。很多情况下有许多其他数据系统如Excel、SPSS和Teradata、DB2、Sybase等商业数据库中存有数据集,使用infile、libname等语句和“导入数据”窗口能使用户从系统外部提取这些数据文件并转化成为SAS数据集。
SAS数据集是已定变量数据体,它是SAS加工、分析、输出报告的基础,因此首先要学会构建SAS数据集,特别是临时数据集。构造SAS数据集的方法有多种,除了本章介绍的生成SAS数据集的方法之外,许多SAS过程也可输出数据集作为分析或计算的结果,也可能还要对它们作进一步分析。关于如何将加工步过程输出的SAS数据集作为进一步分析数据的基础,将在介绍这些过程时另行介绍。本章不介绍加工步如何产生数据集,仅介绍5种直接得到SAS数据集的方法。其中3.1节和3.2节介绍的两种方法是直接通过键盘输入数据集:一种是input语句和datalines语句配合数据体产生SAS数据集,另一种是表编辑器产生SAS数据集;3.3节介绍导入已经存在的待定变量数据体(外部文件)的方法:data语句、infile语句配合input语句导入待定变量数据体形成SAS数据;3.4节介绍通过“导入数据”窗口把其他软件系统的已定变量数据体转化成SAS数据集;3.5节介绍libname语句配合数据引擎导入已定变量数据体形成SAS数据集。通常这3种方法首先把外部数据文件导入成临时文件。3.1节和3.2节介绍的方法在初学SAS时常使用,适用于数据体的行和列不多的情形。3.3节介绍的方法适用于数据体已形成且待定变量数据体没有固定变量名,而数据量很大不便于拷贝的情形。3.4节介绍的方法把部分别的软件系统(例如Excel、SPSS等)的已定变量数据体文件方便地导入并转化成SAS数据集,但是哪些系统的数据文件能用该方法被导入则由SAS软件的版本决定,版本越高,能导入的系统越广泛。3.5节介绍的方法能把“导入数据”窗口无能为力的别的数据系统(例如DB2、Oracle或Sybase)的已定变量数据体文件导入并形成SAS数据集。(www.xing528.com)
3.1至3.3节介绍建立SAS数据集时,需要指明变量的值是数字还是字符串。当变量的值是数字时,无需指明它是实型还是整型。
对于使用次数较多的变量值和变量名,应当尽量简化它们,通常用少数几个字母或数字代表它们,以便加快运算速度,然后通过将在5.2.2节中介绍的format过程和format语句以及label语句在输出时更多地展示它们的信息。
注意:将数据表格拷贝至Editor窗口时,其中的横线和竖线会自动消失。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。