根据变量性质的不同,两个变量的相关可以分为积差相关、等级相关、质量相关、品质相关等。不同相关分析方法对变量性质的要求也不同,详见下表:
变量类型与相关分析方法选择
需要注意的是:在进行积差分析之前,我们必须先做散点图,以确定变量之间的相关关系是线性相关还是曲线相关,以及数据中是否存在异常点,否则可能会得出错误的结论。线性相关分析研究的是两个变量之间的线性相关关系,而曲线相关分析则可用曲线回归方法来分析。
基本操作过程:
1.建立至少包含两个变量的SPSS数据文件。
2.单击【Graphs-Scatter】菜单项,打开【Scatterplot】对话框,选择【Simple】,单击【Define】按钮,打开【Simple Scatterplot】对话框,将左边变量框中两个待检变量分别移入【Y Axis】和【X Axis】框中,然后单击【OK】执行SPSS制图命令,绘制散点图。从图中判断这两个变量之间的相关关系是线性相关还是曲线相关,若二者呈线性相关即可进行二元变量相关分析,否则要调用曲线回归方法进行分析。
3.单击【Analyze】—【Correlate】—【Bivarite】菜单项,打开【Bivarite Correlations】主对话框,在左侧的变量框中选择至少两个要进行分析的变量,单击右向箭头按钮,使之移至【Variables】框中。
4.根据变量性质在【Correlation Coefficients】栏中确定相关系数计算方式,共三种:
(1)【Pearson】(皮尔逊积差相关):用于计算连续变量或是等间距测度变量间的相关分析。
(2)【Kendall’s tau-b】(肯德尔等级相关):用于计算分类变量间的秩相关。当参与分析的变量是连续型数值变量时,若选择此项,系统自动对连续变量的值求秩,再计算其相关系数。
(3)【Spearman】(斯皮尔曼等级相关):用于计算等级数据的相关或数据资料不服从双变量正态分布的相关。
5.在【Test of Significance】栏中选择显著性检验类型:
(1)【Two-tailed】:双侧检验,当事先不知道相关方向时选择此项;
(2)【One-tailed】:单侧检验,如果事先知道相关方向可以选择此选项。
6.【Flag significant correlations】:表明显著水平,如果选择此项,输出结果中在相关系数值右上方使用*标示显著性水平为0.05,用**标示其显著性水平为0.01。
7.打开【Options】对话框,选择要求输出的统计量【Statistics】,包括均值和标准差、“叉积离差”矩阵和协方差矩阵;设置缺失值的处理方法【Missing values】,包括【Exclude Case pairwise】:仅剔除正在参与计算的一对变量中有缺失值的记录;【Exclude Case listwise】:剔除在主对话框中Variable框内列出的所有变量中带有缺失值的记录。
8.点击【Continue】返回主对话框。单击【OK】,执行SPSS命令。
(一)连续变量的相关分析
【案例分析】
例如,下表中给出了某班29名13岁男生的身高(cm)、体重(kg),我们想要考察两个变量之间相互关系的密切程度。
13岁男生的身高和体重原始数据
1.SPSS操作步骤
(1)建立SPSS数据文件。定义两个变量“身高”“体重”,变量类型均为【Numeric】型。
数据文件结构图
(2)单击【Graphs】—【Legacy Dialogs】—【Scatter/Dot】菜单项,打开【Scatter/Dot】对话框,选择【Simple Scatter】,单击【Define】,打开【Simple Scatterplot】对话框,先将左边变量框中的“体重”和“身高”两个变量分别移入【Y Axis】和【X Axis】框中,然后单击【OK】执行SPSS制图命令,绘制散点图。我们从图中可以初步判断,学生的身高和体重呈线性相关关系。之后便可以进行二元变量相关分析。
学生身高与体重的关系散点图
(3)鼠标单击【Analyze】—【Correlate】—【Bivarite】菜单项,打开【Bivarite Correlations】主对话框(如图),在左侧的变量框中选择“身高”和“体重”,单击向右箭头按钮,使之移至【Variables】框。在【Correlation Coefficients】栏中选择Pearson(皮尔逊)积差相关系数。
(4)单击【Options】打开对话框,在【Statistics】中根据题目要求选择均值、标准差、协方差等(如不需要可不勾选),点击【Continue】返回主对话框,单击【OK】,即可执行SPSS命令。
2.输出结果分析
(1)描述性统计表:
Descriptive Statistics(www.xing528.com)
上表显示了参与计算的变量的描述性统计量,分别给出了学生身高与体重的均值、标准差以及参与统计的被试个数。
(2)相关性表:
Correlations
(续表)
**.Correlation at 0.01(2-tailed):……
从相关性表格中可以看出,学生身高与体重的相关系数r=0.725,且显著性水平为0.000<0.01,因此学生身高与体重的相关性呈高度相关。
注意:本例中相关系数的P值显示为0.000[“Sig.(2-tailed)”行],但这不意味着P值真的是0,而是P<0.001。因此本例中统计上两变量间的相关系数不是0。请注意,P值不代表相关关系的强弱,只代表统计上相关系数是否等于0。
(二)次序型变量的相关分析
等级相关分析的SPSS操作步骤同积差相关的操作步骤类似,区别在于在【Correlation Coefficients】栏中选择【Kendall’s tau-b】肯德尔相关还是【Spearman】斯皮尔曼等级相关系数,使用时要格外注意变量的性质。
(三)偏相关分析
在使用相关分析来分析两个变量之间的关系时,往往会受到第三个变量的影响,导致相关系数不能准确地反映两个变量之间的线性关系,此时,偏相关可以有效地解决这一问题。偏相关是指在有效控制了一个或几个其他变量影响的条件下两个变量之间的相关关系。
【案例分析】
例如,下表中给出了某班学生的IQ值、语文成绩以及数学成绩,试用偏相关分析分析语文成绩与数学成绩之间是否存在显著相关。
1.SPSS操作步骤
(1)建立至少包含三个变量(其中至少有一个为控制变量)的SPSS数据文件。在此案例中,需要建立三个变量:“IQ值”“语文成绩”和“数学成绩”。
数据文件结构图
(2)单击【Analyze】—【Correlate】—【Partial】菜单项,打开【Partial Correlation】主对话框,在左边源变量框中选择“语文成绩”和“数学成绩”,单击右向箭头,使之移至【Variables】变量框中。再选择“IQ值”作为控制变量,将其送入【Controlling for】(控制变量)框中。
(3)【Test of Significance】栏中,选择【Two-tailed】,因为我们并不清楚三者之间是怎样的关系。
(4)打开【Options】对话框,在【Statistics】统计值栏内,选择【Zero-order correlations】(零阶相关系数)这一选项,系统会输出简单相关系数,以便与偏相关系数进行比较。(注意:在偏相关中,若控制变量个数为一时,偏相关系数称为一阶偏相关系数;若控制变量个数为二时,称为二阶偏相关系数;若为零时,称为零阶相关系数,即相关系数。)还要选择【Means and standard deviations】选项,输出描述统计量。
(5)点击【Continue】返回主对话框,单击【OK】,即可执行SPSS命令。
2.输出结果分析
(1)描述统计表:
Descriptive Statistics
上表输出的结果是参与统计的各变量的平均数、标准差和被试个数。
(2)相关性表:
PAR TBN Correlations
(续表)
a.PAR ANN zero-order correlations
上表是零阶相关和偏相关输出的结果,从中可以看出在没有控制IQ时语文成绩与数学成绩之间的相关系数为0.991,且显著性双侧检验为0.000<0.01,表明二者存在显著相关;在控制一个变量(IQ)的条件下,语文成绩与数学成绩相关系数为0.893,显著性水平为0.000。所以,语文成绩与数学成绩相关系数为正向且强相关。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。