首页 理论教育 结构嵌套均值模型及其对处理变量的因果效果分析

结构嵌套均值模型及其对处理变量的因果效果分析

时间:2023-07-08 理论教育 版权反馈
【摘要】:与边际结构模型相比,结构嵌套均值模型则关注某一特定时间点上的处理变量At的取值对于最后响应变量Y的因果效果。具体而言,结构嵌套均值模型对于结果变量Y进行了分解。基于上述的分解,可以用线性表达式来表示μ1和μ2。如果Y是连续型变量,假定ψ服从均值为零,方差恒定的正态分布。具体而言,ε1代表L1对于Y的取值的影响。换句话说,在时间点2上引入的L2,是要剥离L1和A1的影响之外的新的影响力。

结构嵌套均值模型及其对处理变量的因果效果分析

与边际结构模型相比,结构嵌套均值模型则关注某一特定时间点上的处理变量At的取值对于最后响应变量Y的因果效果。由于存在多个时点,因此这种特定时间点上的处理效应也叫条件中间因果效果(conditional intermediate causal effect)。

具体而言,结构嵌套均值模型对于结果变量Y进行了分解。以两个时间点为例,Y的变化取决于A1、A2、L1和L2的值,因此,Y的期望值可以表示为Ey[Y(A1,A2)]|L1,L2,A1,A2。显然,参照组可以写成Ey[Y(A1=0,A2=0)]|L1,L2,A1,A2=Ey[Y(0,0)]|L1,L2,A1,A2。进一步,结构嵌套均值模型可以将Ey[Y(A1,A2)]|L1,L2,A1,A2-Ey[Y(0,0)]|L1,L2,A1,A2进行了分解,如下所示:

由于Y(A1,A2)包含了A1和A2的取值,A1只受到L1的影响,参照组的情况则既不受L1也不受L2的影响,因此Ey[Y(A1,0)-Y(0,0)]|L1,L2,A1,A2的可以进一步简化,即

同理,A2受到L1,L2和A1的影响,因此Ey[Y(A1,A2)-Y(A1,0)]|L1,L2,A1,A2也可以进一步简化:

对于结构嵌套均值模型而言,我们希望得到的各个时间点上的处理效应,而这些处理效应本身是受到前面各个时点的处理变量取值A以及一系列混淆变量L影响的。因此,对于每个时间点,其处理效应本身是一个条件效应,取决于之前的A和L。例如,对于时间点1,A1的效果取决于L1,因此,时间点1的条件中间因果效果可以表示为

对于时间点2,条件中间因果效果可以表示为

那么,基于简单的数学运算,我们可以在公式(12 1)的基础上同时增加和减少Ey[Y(0,0)]|L1,从而得到

同理,对于公式(12-2),同时增加和减少Ey[Y(A1,0)]|L1,L2,A1,得到(www.xing528.com)

至此,我们可以把Ey[Y(A1,A2)]如下分解:

其中,最右边的符号指代等式右边的五项内容。β0代表了基线情况Ey[Y(0,0)],即当A1和A2都为0的时候的Y的取值。μ2表示因为A2的变化带来的相比于时间点1时Y的变化,ε2则表示引入L2后带来的相比于时间点1时Y的变化,μ1表示因为A1的变化,相比于基线状态带来的Y的变化,ε1则表示引入L1后带来的Y的变化,同样,参照标准依旧是基线标准。

基于上述的分解,可以用线性表达式来表示μ1和μ2。例如,由于μ1是L1的函数,且当A1取值为0的时候,μ1等于0,将μ1表示为A1×f(L1),其中f(L1)是L1的函数。最简单的函数就是L1本身,则此时μ1=A1×L1。更为复杂的函数可以是抛物线,例如f(L1)=L 21+L1,那么μ1=A1×(L 21+L1)。同理,μ2是L1,A1和L2的函数,且A2等于0的时候,μ2也等于0。那么,我们可以将μ2表示为A2×f(L1,L2,A1)。至于ε1和ε2,我们不一定将其写成一个明确的函数表达式。这是因为我们所关心的是μ1和μ2如何影响Y的取值,换句话说,可以将上面的表达式中的ε1和ε2统一写成γ。此时,模型变成了

对于特定的数据,拟合的模型就是Y(A1,A2)=β01A1×f(L1)+β2A2×f(L1,L2,A1)+γ+ψ。如果Y是连续型变量,假定ψ服从均值为零,方差恒定的正态分布。此时,通过估计方程来估算β1和β2。具体而言,计算Y(A1,A2)-β1A1×f(L1),这个表达式将A1在时间点1上对于Y的影响去除掉了。因此,这个表达式应该和A1彼此独立,即其协方差为0,得到

同理,可以计算Y(A1,A2)-β1A1×f(L1)-β2A2×f(L1,L2,A1),这个表达式应该和A2独立,因此,

至此,β1和β2的取值应该同时满足等式(12 5)和等式(12 6),从而可以估计出其取值。

另外一种系数估计方法则要求我们明确地写出ε1和ε2的表达式。具体而言,ε1代表L1对于Y的取值的影响。因此,最简单的一个表示方法就是ε1=L1。对于ε2,它所要表达的意思是在时间点2时,因为引入L2所带来的相比于时间点1时Y的新变化。换句话说,在时间点2上引入的L2,是要剥离L1和A1的影响之外的新的影响力。此时,一个最直观地对ε2的表示是L2在考虑过L1,A1之后的残差。具体而言,我们可以用L1和A1去拟合L2的值,然后计算残差L2res。此时,ε2可以设定为L2res。值得说明的是,在每一个对μ1和μ2以及ε1和ε2的表达式中,都可以引入基线的一些变量,或者中间随时间变化的一些变量。尤其是,将这些变量和相应的μ1和μ2进行交互,就能够得到这些变量对于时间点1和时间点2的处理效果的调节(moderation)效应了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈