数据命令是Mplus必须的命令,用于指定数据文件存放的路径。
(1)数据准备
心理学及社会科学研究者经常使用SPSS作为数据管理和统计分析的工具。使用SPSS的一个好处是可以通过SPSS将数据转换成与其他统计分析软件对接的数据格式或自由格式。具体通过SPSS的“FILE”下拉菜单中的“SAVE AS”来实现。不像其他结构方程软件可以读取多种数据文件,Mplus只能读取ASCII格式文件(通常后缀为.dat和.txt的文件)。
Mplus可以识别自由和固定两种结构的数据。由于心理学等社会科学领域的研究样本量通常不是很大,涉及的变量也不是很多,所以使用自由格式数据比较普遍。当样本量和变量很多时,使用固定格式的数据读取速度更快。Mplus通过DATA命令指定与数据相关的信息。FILE语句用于指定数据文件的存储路径和文件名。例如,
FILE is c:\mplus\ptsd.dat;
上述指令提示文件名为ptsd.dat,存储路径为C盘Mplus文件夹。在自由格式数据文件中,每列为一个变量,变量之间用空格、逗号或制表符进行限定,缺失值必须用“.”或其他数值代替(如,9或99),否则会发生读取错误。Mplus对变量数是有限制的,变量数的上限是500,字符的长度是5 000。也就是说,数据文件中最多能包含500个10位数的变量。
(2)数据格式
固定格式
在固定格式文件中,每个变量所占字符数必须相等,FORTRAN式的定义是可以被Mplus接受的。常用的FORTRAN的描述符有“F”“x”“t”“/”。其中F用于指定变量的格式,其后可以跟整数,也可以跟小数。整数表示变量是没有小数点的整数值,整数表示是几位数;如果是小数则说明数据含有小数点,小数点前的数值代表数据包含几个数字,小数点后的数字表示数据包含几位小数。例如,12.36可写成F4.2的形式为1236。F前也可以有整数值,表示有多少个F,例如F4.1,F4.1,F4.1,F4.1,F4.1,可缩写为5F4.1。
x字符用于表示跳过多少列不读取,如25x,表示跳过25列不读。
t字符用于指定具体读取某列变量,如t30,表示读取第30列。
下面的语句:FORMAT IS 5F4.1,5x,t30,5F5.2;
第一个5F4.1是5个F4.1的缩写形式,即表示F4.1,F4.1,F4.1,F4.1,F4.1。第2个5x表示跳过5列数据不读取。t30表示直接读取第30列的数据,最后的5F5.2与5F4.1一样,表示5个保留2个小数点的5位数。整个数据文件有55位数。
自由格式(www.xing528.com)
自由格式数据文件可以通过上述所说的SAVE DATA获得。具体操作步骤为,打开SPSS文件→FILE→SAVE DATA→对话框选择保存文件类型,下拉选项中选择“Tab-delimited(*.dat)”格式[4],最后单击确定即可。这里需要特别提醒的是,Mplus不能识别数据文件中除数值以外的字符(特定的缺失值标签除外),所以在通过SPSS转换产生*.dat文件时要把原数据文件中的变量名等(非数值型)不需要的信息删去,以避免不必要的错误。
当数据文件的路径和格式等设置好后,还需要提供数据文件内容的信息,这一步通过TYPE来实现的。一般来说,数据文件要么提供单个信息(原始数据)要么提供汇总信息(在原始数据基础上汇总的信息,如相关矩阵、协方差矩阵等)。TYPE命令下共有9种类型可供选择,其中最常用的是INDIVIDUAL,即提供原始数据,也是程序默认的类型。INDIVIDUAL定义的数据矩阵为行表示观测样本,列表示变量。在社会科学研究中,绝大多数数据文件以INDIVIDUAL类型存储,所以通过SPSS转换后的*.dat文件即为这种形式,因此在多数情况下不需要TYPE语句。
另外,在有些情况下需要使用汇总数据。例如,原始数据无法获得,或是需要对某些概念间的相关系数矩阵或协方差矩阵进行元分析。汇总数据必须为自由格式的外部ASCII文件,而且需要使用NOBSERVATIONS注明样本量的大小。例如,TYPE IS CORRELATION MEANSSTDEVIATIONS;
.4.6.3.5.5!均值
.2.5.4.5.6!标准差
1.0
.86 1.0
.56 .76 1.0
.78 .34 .48 1.0
.65 .87 .32 .56 1.0
汇总数据必须提供观测变量的个数,在DATA后加:“NOBSERVATIONS=1 000;”。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。