首页 理论教育 四格表中使用耶茨修正卡方检验

四格表中使用耶茨修正卡方检验

时间:2023-11-21 理论教育 版权反馈
【摘要】:在四格表中,若单元格的最小期望数大于1、小于5,样本容量大于40,可使用耶茨修正卡方检验。似然比卡方检验用于对数线性模型的检验。当行/列变量均为连续型变量时,使用线性相关检验。皮尔逊相关系数用来检验两个连续型变量的线性相关程度,斯皮尔曼相关系数用于检验两个等级变量之间的相关程度。

四格表中使用耶茨修正卡方检验

基本操作过程:

1.建立SPSS数据文件。

2.单击【Analyze】—【Descriptive Statistics】—【Crosstabs】菜单项,在左侧变量框中选择一个或多个变量进入【Row(s)】框中,作为交叉变量的行变量;在左侧变量框中选择一个或多个变量进入【Column(s)】框,作为交叉表中的列变量。

3.根据需要选择一个分层变量进入【Layer】框中。SPSS将根据分层变量的不同取值分别对行变量和列变量进行描述和分析。如果要增加另外一个控制变量,首先单击【Next】按钮,再选入一个变量。单击【Previous】按钮可以重新选择前面确定的变量。

4.【Display clustered bar charts】复选项:选中此项显示每一组中各变量的分类条形图。

5.【Suppress tables】复选项:选中此项则禁止输出交叉表。

6.打开【Exact】对话框,该对话框用于设定是否进行精确概率计算和具体的计算方法,所给出的计算方法有以下几种:

(1)【Asymptotic only】:仅计算近似的概率值,是系统默认项。

(2)【Monte Carlo】:采用蒙特卡罗模拟方法计算精确概率值。蒙特卡罗模拟方法默认进行一万次抽样,给出精确概率及99%置信区间(默认值均可更改)。【Confidence level】:输入0.01到99.9之间的数值,指定置信水平。【Number of samples】:输入1到1000000000之间的数值,指定在【Monte Carlo】近似法计算中的样本数,样本数越大则求得的概率值越精确。

(3)【Exact】:计算精确概率值。默认计算时间限制在5分钟内,超过时限则自动停止。

7.打开【Statistics】对话框,按要求输出所需统计量。

(1)【Chi-square】:进行行变量、列变量的独立性的皮尔逊卡方检验(Pearson chi-square test)、似然比卡方检验(Likelihood ratio chi-square test)、线性相关检验(Linear by linear association chi-square test)、费舍精确检验(Fisher’s exact test)和耶茨修正卡方检验(Yete’s corrected chi-square test)。如果数据满足卡方检验的要求,可使用皮尔逊卡方检验。在四格表中,若单元格的最小期望数大于1、小于5,样本容量大于40,可使用耶茨修正卡方检验。如果单元格的最小期望数小于1,或样本容量小于等于40,则要使用费舍精确检验。似然比卡方检验用于对数线性模型的检验。当行/列变量均为连续型变量时,使用线性相关检验。

(2)【Correlations】:相关系数项,仅对数值型变量有效。皮尔逊相关系数用来检验两个连续型变量的线性相关程度,斯皮尔曼相关系数用于检验两个等级变量之间的相关程度。

(3)【Nominal】:包含一组用于反映称名变量相关性的指标。

①【Contingency coefficient】:列联系数,可描述两个变量之间关联性的高低,它由卡方值经过计算得出。其数值介于0和1之间,数值为0表示行变量与列变量之间没有关联。数值越接近1,表示行变量与列变量之间的关联越强。

②【Phi and Cramer’s V】:与列联系数一样,Phi系数和Cramer’s V系数也是用来描述两个变量之间关联性的高低,均由卡方值得出。其值介于0和1之间,绝对值越大,相关性越强。

③【Lambda】:用于反映自变量因变量的预测误差。Lambda系数等于1,表明自变量可完全预测因变量;系数值等于0,表明自变量不能预测因变量,彼此之间独立。

④【Uncertainty coefficient】:不确定系数,表示使用一个变量的值来预测其他变量的值可能发生的错误。不确定系数越接近其上限1,表明从第一个观测值获得的有关第二个变量的值的信息越多;不确定性系数越接近其下限0,则表明从第一个观测值获得的有关第二个变量的值的信息越少。

(4)【Ordinal Data】:包含一组用于反映顺序变量相关性的指标。

①【Gamma】:反映两个顺序变量之间的对称关联,其值的范围在-1到1之间,其绝对值为1时,表明两个变量间存在很强的关联,其值为0时则表明两者相互独立。

②【Somers’d】:反映两个顺序变量间的关联性,其值的范围在-1到1之间。

③【Kendall’s tau-b】:对相关的顺序变量进行相关分析。其值范围在-1到1之间,符号表明两变量之间的相关方向。

④【Kendall’s tau-c】:由上一个改进而来,在其基础上对表的大小进行了校正。

(5)【Nominal by Interval】:适用一个为称名变量、另一个为等距变量的检验。

【Eta】:系统计算两个Eta值,一个是将行变量作为因变量,另一个是将列变量作为因变量。Eta的平方表示组间平方和所解释的因变量总平方和的比例,即Eta2=SS组间/SS总和,其值介于0到1之间,值越大表示行、列变量之间的关联性越高。

(6)【Kappa】:计算内部一致性系数,用于检验两个评估者对同一对象进行评估时是否具有一致性,仅适用于具有相同分类值和相同分类数量的变量交叉表,如2×2交叉表。其值介于-1到1之间,-1表示两者完全相反,0表示两者没有共同点,+1表示两者完全一致。

(7)【Risk】:计算相对危险度和比数比,可检验变量相对某一特定事件的关系,仅适用于2×2交叉表。如果其值小于或等于1,则不能确定事件的发生和因素暴露存在关联;如果大于1,说明两者之间有关联,该因素对事件的发生有影响。

(8)【McNemar】:用于两个相关的二项变量的非参数检验

(9)【Cochran’s and Mantel-Haenszel statistics】:用于两个二项变量的独立性检验和同质性检验。

8.在主对话框中打开【Cell Display】对话框,在对话框中选择显示在交叉单元格中的统计量,包括观测值数、百分比、残差。

(1)【Counts】计数栏:

①【Observed】:输出实际观测频数。系统默认项。

②【Expected】:输出预测频数。

(2)【Percentage】百分数栏:(www.xing528.com)

①【Row】:输出行百分数;②【Column】:输出列百分数;③【Total】:输出总百分数。

(3)【Residual】残差栏:

①【Unstandardized】:输出原始残差(未标准化),即单元格中的实测频数与预测频数的差值。

②【Standardized】:输出标准化残差,残差除以其标准误,均值等于0,标准误等于1。

③【Adj.standardized】:输出校正后的标准化残差。

9.打开【Format】对话框,输出行变量显示顺序:

①【Ascending】:行变量从左到右升序显示。系统默认项。

②【Descending】:行变量从左到右降序显示。

10.回到主对话框,单击【OK】按钮,即可执行SPSS命令。

【案例分析】

例如,欲分析高校男、女教师的工作满意程度在性别构成上是否存在显著性差异,获得的数据如下表:

多维频数分析原始数据

1.SPSS操作步骤

(1)根据案例建立三个变量“问卷编号”“性别”和“工作满意度”。

(2)单击【Analyze】—【Descriptive Statistics】—【Crosstabs】菜单项,打开【Crosstabs】主对话框。将左侧变量框中的变量“性别”移至【Row(s)】框,将变量“工作满意度”移至【Column(s)】框,同时选择【Display clustered bar charts】复选项,输出条形图。

(3)单击【Exact】按钮,打开【Exact Tests】对话框。选中【Exact】选项,并默认计算时间限制在5分钟内。单击【Continue】按钮返回主对话框。

(4)打开【Statistics】对话框,选择【Chi-square】复选项,单击【Continue】按钮返回主对话框。

(5)单击【Cells】按钮,打开【Cell Display】对话框,在对话框中的【Counts】栏下选择【Observed】、【Expected】,在【Percentages】栏下选择【Row】和【Column】,其他项默认。单击【Continue】按钮返回主对话框。

(6)打开【Format】对话框,在【Row Order】栏下选择【Ascending】。单击【Continue】按钮返回主对话框。单击【OK】按钮,即可执行SPSS命令。

2.输出结果分析

(1)案例处理摘要:

Case Processing Summary

上表输出的结果从左到右依次给出了有效个案样本数量448、缺失值0、总数448。

(2)性别*工作满意度交叉表:

性别 * 工作满意度 Crosstabulation

上表输出结果中根据男、女分类分别给出了男、女教师对工作满意度不同态度的实际计数、预期计数、在性别内的百分比、在工作满意度内的百分比。

(3)卡方检验:

Chi-square Tests

a.0 cells (0.0%) have expected count less than 5.The minimum expected count is 11.90.

上表输出的结果中给出了皮尔逊卡方检验值为100.385,似然比卡方检验值为108.465,费舍精确检验为107.018,自由度为3,近似显著性(双尾)概率值为0.000<0.05,精确显著性概率值为0.000<0.05。因此,可以否认零假设,说明男、女教师在工作满意度上存在性别差异。

(4)条形图:

上图是此案例的条形统计图,描绘了男、女教师在不同工作满意度上的人数分布量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈