(一)反事实概念框架
在当前国情下,我国农村一般大龄男性[3]都已成婚,可视为控制组或对照组(D=0),那些少数未成婚的个体则为干预组或处理组(D=1)。无论其真实婚姻状况如何,在理论上某农村大龄男性i婚姻状况存在两种潜在状态(Potential Outcome):未婚或已婚,其相应主观福利水平分别为Y1 i与Y0 i。显然,Y0 i与Y1 i中有且仅有一个是可观测到的事实,而另一个则为反事实。
对干预组观测值即农村大龄未婚男性而言,其主观福利水平为Y1 i|D=1,则该男性若已婚即反事实结果下主观福利水平为Y0 i|D=1。类似地,控制组中农村已婚男性也有两种潜在主观福利水平(Potential Outcome),即真实结果Y0 i|D=0和反事实结果Y1 i|D=0。因为反事实结果是永远观察不到的,故我们不能直接估计婚姻状况对具体男性i的因果影响,但可以估算出大龄未婚对农村男性主观福利的平均干预效应。在反事实概念框架下[4],大龄未婚对农村未婚男性主观福利影响,是大龄未婚男性主观福利水平期望值减去其若已婚时的主观福利水平期望值,通常称为干预组的平均干预效应(Average Treatment Effect on Treated,ATT),
而我们观察到的大龄未婚农村男性与已婚男性主观福利差距,除了干预组的平均干预效应,还有一部分应归于选择偏差。这需要我们应用倾向得分匹配方法处理选择偏差,估算大龄未婚对农村男性主观福利影响的ATT效应。
(二)倾向得分匹配方法
通常使用倾向得分匹配方法(PSM)降低匹配变量的维度。该方法依据影响农村男性婚姻状况的宏观因素和个体特征,估算出每一个农村男性潜在的处于大龄未婚状态的概率,即倾向得分(Propensity Score):
式(4)表明,给定向量Xi,倾向得分p(Xi)是农村男性是否处于大龄未婚状态(D=1)的预测概率。倾向得分相近的未婚观测值和已婚观测值构成了共同支撑领域。该领域排除了在倾向得分尾部分布的农村男性,从而提高了匹配质量,同时也会导致样本量减小。Heckman等(1997)指出,非参数匹配方法仅应用于共同支撑区域时才有意义[17]。给定未婚倾向得分,干预组与控制组观测值在所有影响婚姻状态的宏观因素和个人社会经济条件上,均不存在系统性差异,即满足平衡性假设。根据Rosenbaum和Rubin(1984)[15]的研究,式(2)可变换为:
倾向得分匹配方法本质是一种分层后的加权算法。对于任一农村大龄未婚男性i,都可能匹配到J(J≥1)个与其未婚倾向得分接近已婚男性。这时(www.xing528.com)
为了保障结论的稳健性,本文将使用最近邻匹配法(Nearest Neighbor Matching)、半径匹配法(Radius Matching)和核匹配法(Kernel Matching)等三种主流倾向得分匹配技术,对大龄未婚影响农村男性主观福利的ATT效应进行估计。
(三)匹配加权最小二乘法
匹配方法论要意在于消除样本异质性。就估计ATT效应而言,匹配方法致力于在控制组中遴选与干预组样本足够相近的观测值。这就催生了另一种估计ATT效应的思路:匹配加权最小二乘法。该方法根据大龄未婚的概率,对控制组观测值赋予不同的权重;倾向得分与干预组样本愈接近的控制组观测值,被赋予越大的权重[15]。
具体而言,首先根据式(2)计算出农村男性大龄未婚的倾向得分p(Xi)。干预组即农村大龄未婚男性观测值的权重为1,控制组即已婚观测值权重为
然后以r i作为控制组观测值权重,1作为干预组权重,进行加权最小二乘回归。
匹配加权最小二乘法还具有独特的优势。就本文研究的问题而言,不同地区的观测值,对婚姻的态度和主观福利的认知,可能都存在系统性差异。不过,受限于样本量和匹配平衡性条件假设,在计算未婚倾向得分时,就难以控制地区固定效应。该方法的优势还在于,无论是主观福利决定方程,还是大龄未婚决定因素方程,只要其中一个模型设定正确,匹配加权最小二乘法都可以得到一致性估计结果。因此,也被Robins等(2007)称为双重稳健性估计方法(Double-Robust Estimators)[18]。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。