在这一部分,我们介绍一下控制直接效应。如上文所述,所谓控制直接效应,是指分析自变量到响应变量的关系如何随着中介变量的取值不同而不同。也就是说,虽然控制了中介变量,但是自变量与响应变量的关系仍然随着中介变量的取值不同而产生出异质性特征。和一般的中介分析一样,控制直接效果的估计需要考虑潜在的混淆因素。这里,我们介绍Zhou和Wodtke(2018)提出的残差回归(regression-with-residuals)方法。相比于传统的g-estimation,这个方法可以很好地处理中介因素与其他中间变量的交互效应。
图11-5 控制直接效应图示
假设中介关系如图11-5所示,除了自变量X、中介因素M和响应变量Y之外,可能会有随时间变化的混淆因素L,不同的时点的L的取值定义为L1和L2。我们感兴趣的是在控制了M之后,X对Y的影响。但是在这里,同时会控制混淆变量L1和L2的取值。L2在这里是X到Y的影响的M之外的一条路径,如果不控制L2,则即使控制了M,X对Y的关系也是受到混淆效应影响的。但是,在控制了L2之后,由于L2是一个collider,L1和A之间本来因为控制了L1之后被打断的关系得以恢复,结果T对Y的影响还会因为T←L1→Y这条线受到混淆。[1]因此,如果处理L1和L2这样的混淆因素是估计控制直接效应的关键。
残差回归的方法能够解决这一问题。具体而言,回归残差方法有两步:
第一步,针对L2,用所有影响其取值的因素L1和X构建回归模型,得到其残差项。例如,假设L2是连续型的,则假设其服从正态分布,拟合模型L2=β0+β1 X+β2L1+ε,其中ε服从均值为零,方差恒定的正态分布。基于此模型,计算L2的残差将其表示为L2res。
第二步,针对响应变量Y,拟合回归模型,只是其中的L2替换为L2res,例如,如果Y也是服从正态分布的连续型变量,有
其中,随机扰动项τ也服从均值为零,方差恒定的正态分布。基于此模型,在M的不同取值之下,X对Y的影响效果可以表示为换句话说,如果我们让X从0变到1,得到的控制直接效应就是。显然,M的不同取值,会带来控制直接效果的不同。
直观上讲,回归残差方法是很好理解的。由于L2res是在控制了L1和T之后剩余的信息,图11-3中L1和X对L2的影响就被打断了。因此,只要使用L2res而不是原始的L2,我们就能够用传统的估计方法来无偏的估计各个系数,包括我们感兴趣的控制直接效应,如图11-6虚线所示。
(www.xing528.com)
图11-6 残差回归原理
上面描述的分析过程假设M和L2之间不存在交互效应,如果二者存在交互,我们就需要对上述分析过程做一定的修改。例如,仍旧按照上述方法来计算L2res,但是在分析Y的时候,模型变成:
之后,控制直接效应还是。上述的分析过程可以通过下面的代码实现:
通过输出结果可以发现,控制直接效应可以表示为0.04-0.001×收入。其中0.04为主效应,而-0.001来自教育水平和收入的交互效应。
我们可以利用summary命令看一下收入的基本信息,得到以下结果。
那么,在个人收入变量取值在最小值、第一个四分位数、中位值、均值、第三四分卫数和最大值的时候,所对应的个体教育水平对幸福感的影响值分别是0.038 6、0.030 8、0.030 2、0.029 7和0.024 4。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。