首页 理论教育 多元统计分析中的随机系数模型

多元统计分析中的随机系数模型

时间:2023-10-30 理论教育 版权反馈
【摘要】:在空模型基础上进一步纳入水平1解释变量,且均设定为随机效应,但并未将解释变量纳入水平2模型,此模型即为随机系数模型。在此模型中,β0j、β1j、β2j、β3j被称之为随机系数。例如,判断截距和斜率是否为随机系数,只需判断社区层面模型中是否成立,若成立,则需将其设定为固定系数。图12-16报告了AIC、AICC和BIC三个信息标准值和-2LL较空模型均有所减少,说明纳入随机斜率后的模型拟合效果较好。

多元统计分析中的随机系数模型

在空模型基础上进一步纳入水平1解释变量,且均设定为随机效应,但并未将解释变量纳入水平2模型,此模型即为随机系数模型(Raudenbush,et al.,2007)。纳入水平1解释变量的随机截距模型旨在控制水平1变量效应的背景下更精确地估计宏观层面变量的效应,而随机系数模型旨在控制宏观层面随机误差项,研究个体层面变量对因变量的影响,它也是多层模型构建中的重要一环。我们将中心化后的水平1解释变量健康自评、教育程度和流动原因纳入模型,并将截距和斜率均设定为随机效应,建构随机系数模型如下:

γ00表示社区层回归截距的平均值,也是模型的总截距,μ0j是社区j对平均截距β0j的随机效应;γ10、γ20、γ30分别表示回归斜率β1j、β2j、β3j的平均值,μ1j、μ2j、μ3j分别是社区j对斜率β1j、β2j、β3j的随机效应,eij为水平1的残差项。在此模型中,β0j、β1j、β2j、β3j被称之为随机系数。在此模型中,随机系数是指回归截距和系数是跨社区变化的,也就是说回归系数和截距会随社区的变化而变化。随机系数被区分为两个部分,第一部分是整体斜率(γ10、γ20、γ30)和截距(γ00),是从所有流动人口中估计得出,而与流动人口属于哪一个社区无关;第二部分是斜率(μ1j、μ2j、μ3j)和截距方差(μ0j),表示每一个社区的截距和斜率与整体截距和斜率有所差异的部分(ItaKreft,et al.,2007)。固定系数是指回归系数和截距是一个常数。

对于分层线性模型,我们假设水平1截距和斜率的变异呈现正态分布,其分布以平均截距(γ00)和斜率(γ10、γ20、γ30)为均值,以社区层面的残差方差为方差。判断回归系数是否为随机系数,可以通过z检验判断社区层面的残差项的方差为0是否成立。例如,判断截距和斜率是否为随机系数,只需判断社区层面模型中是否成立,若成立,则需将其设定为固定系数。与固定和随机系数相对应的是固定和随机效应。例如,A代表不同的流动人口,若研究者关心的每一位流动人口均已包含在研究中,那么我们称之为固定效应,其研究结论也仅能代表所研究的流动人口;相反,若研究包含的流动人口仅为所有流动人口中的(随机)抽样,则需要将其设定为随机效应,以将研究结论推广到总体(全国流动人口)。

随机系数模型的SAS程序及结果如下。

SAS程序:

proc mixed data=mig_c method=reml covtest;

class c6;

model h_edu=SRH_c edu_c mig_reac

/solution ddfm=bw notest;

random int SRH_c education_c mig_reac/subject=c6;

run;

SAS结果:(www.xing528.com)

SAS部分结果输出如下:

图12-14 迭代历史

图12-15 协方差参数估计

图12-16 模型拟合参数

图12-17 固定效应估计

SAS结果解释:

图12-14表明模型评估经过3个迭代后就成功收敛了。图12-16报告了AIC、AICC和BIC三个信息标准值和-2LL较空模型均有所减少,说明纳入随机斜率后的模型拟合效果较好。图12-15报告了水平1随机截距方差和随机斜率残差方差估计,健康自评和流动原因的水平2残差方差的p值均大于0.05,说明健康自评和流动原因的系数均为固定效应,因此需要进一步将其设定为固定效应。图12-17显示,健康自评每增加一个等级,其接受健康教育的种类就增加0.1311种;高中及以上流动人口较初中及以下流动人口接受健康教育种类多0.2168种;务工经商流动人口较非务工经商接受健康教育多0.2098种。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈