首页 理论教育 SAS实现-多元统计分析的模型拟合指标

SAS实现-多元统计分析的模型拟合指标

时间:2023-10-30 理论教育 版权反馈
【摘要】:常用的拟合优度指标有以下几种,大部分在SAS的结果中都会提供。若χ2值很小则意味着模型预测值和观测值之间没有显著差别,表示模型很好地拟合了观测数据。D统计量以可以完全反映观测数据的模型为基础,来比较进行验证的模型与完全模型的最大似然值,通过似然函数来测量验证模型和完全模型之间的差异程度,当D值较大时,则意味着模型拟合较差。

SAS实现-多元统计分析的模型拟合指标

模型的拟合优度(goodness of fit)指评价模型能否有效描述反变量及模型拟合数据的程度,如果模型预测值与实际观测值之间的差异是可以接受的,则表示可以接受这一模型(David et al.,2012)。常用的拟合优度指标有以下几种,大部分在SAS的结果中都会提供。

1.Pearson χ2值(Pearson Chi-Square Statistic)和D统计量(Deviance)

Pearson χ2值是通过比较模型预测事件发生和不发生的频数与实际观测事件发生和不发生的频数来检验模型成立的假设。若χ2值很小则意味着模型预测值和观测值之间没有显著差别,表示模型很好地拟合了观测数据。D统计量以可以完全反映观测数据的模型为基础,来比较进行验证的模型与完全模型的最大似然值,通过似然函数来测量验证模型和完全模型之间的差异程度,当D值较大时,则意味着模型拟合较差。Pearson χ2值和D统计量都服从于渐进的χ2分布,主要用于自变量不多且为分类变量的情况。

在SAS中,需要通过设置aggregate和scale两个选项来对协变量类型进行设置,才能输出Pearson χ2值和D统计量。

2.HL指标(The Hosmer-Lemeshow tests,HL)(www.xing528.com)

HL指标是一种类似于Pearson χ2值的指标,主要用于自变量较多且含有连续型变量的情况。其对应的零假设H0是预测值概率和观测值之间没有显著差异,如果HL指标显示较大的p值,说明统计结果不显著,则我们不能拒绝关于模型拟合数据很好的假设,这意味着模型很好地拟合了数据。在SAS中需要调用lackfit选项命令来输出HL指标值。

3.信息指标(information measures)

信息指标中最常见的是-2LL(-2 log likelihood)、AIC(Akaike's information criterion)和SC(Schwarts criterion)。其中-2LL值是模型似然函数值的自然对数再乘以-2,其值越小,意味着Logistic回归模型的似然值越接近于1,模型的拟合程度也就越好。AIC和SC都是在-2LL基础上开发的其他指标,且SC是AIC的一种修正,与AIC同向作用。具体来说,在其他条件不变的情况下,AIC值和SC值越小表明模型拟合程度越好。在SAS中会自动输出上述三个信息指标。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈