首页 理论教育 倾向值匹配:基于估计的多元统计分析方法

倾向值匹配:基于估计的多元统计分析方法

时间:2023-10-30 理论教育 版权反馈
【摘要】:匹配就是将分别处于实验组和对照组,但具有相同或近似倾向值的样本,匹配成为配对。虽然倾向值可以大幅降维,将多维共变量简化成一维数值,但如果严格使用一对一比对相同倾向值的匹配方法,最终的样本数可能会大幅减少,甚至找不到匹配。所以基于估计得到的倾向值e,可以使用不同的标准(或方法)将干预组成员与对照组成员进行匹配。

倾向值匹配:基于估计的多元统计分析方法

匹配就是将分别处于实验组和对照组,但具有相同或近似倾向值的样本,匹配成为配对。虽然倾向值可以大幅降维,将多维共变量简化成一维数值,但如果严格使用一对一比对相同倾向值的匹配方法,最终的样本数可能会大幅减少,甚至找不到匹配。所以基于估计得到的倾向值e(Xi),可以使用不同的标准(或方法)将干预组成员与对照组成员进行匹配。不同标准或方法间差别的实质是对每一匹配上的干预组成员-对照组成员集合计算的权重ϖ(i,j)不同。因此,特定匹配技术的选取会通过所赋予的权重影响得到的干预效应估计值。常用的匹配方法有最近邻匹配、卡尺匹配、分层匹配、内核与局部线性匹配、双重差分匹配等。

1.最近邻匹配

最近邻匹配是最常使用的匹配方法,属于贪婪匹配。其基本原理是在干预组和对照组之间寻找最“相似“的倾向值进行匹配,即将每一干预组成员i与具有最接近的倾向值的对照组成员j(即最近邻)进行匹配。用数学式表示为:

最近邻匹配有两种做法:1对1匹配和1对n匹配。1对1匹配是指选择1个对照组成员j作为最近邻进行匹配;1对n匹配:选择n个(通常n=5)对照组成员j作为最近邻进行匹配。选择最近邻的方式也有两种:既可以是有放回的,也可以是无放回的。首先将干预组和对照组的样本按照倾向值的大小排序。“有放回”意味着同一对照组成员j可被作为不同干预组成员i的匹配对象,即对照组样本可以替换重复使用。如果是“无放回”的,即对照组样本不能替换重复使用,则需确保干预组的样本依序匹配对照组样本,且每一个对照组样本只能匹配一个干预组样本。因为有放回的匹配可能导致丢失更多的对照组成员,由此导致更大的抽样偏差,所以常见的做法是一旦找到与i匹配的j,即将j从I0中去掉而不再放回。

2.卡尺匹配

为了避免最近邻匹配中作为匹配对象的j可能在倾向值上与干预组成员i仍差别很大而出现匹配不佳的问题,卡尺匹配限定“最接近的”范围或条件,即干预组和对照组倾向值的最大容忍差距,超过这个差距的匹配选择放弃。用数学式表示为:

ε是事先设定的匹配容忍度或者分界点,被称作卡尺(caliper)。通常将卡尺大小设定为ε≤0.25ðe(Xi),即倾向值1/4个标准差。由于卡尺匹配以有放回方式选取匹配对象j,有可能丢失更多对照组成员。(www.xing528.com)

3.分层匹配

分层匹配又称区间匹配、子分类匹配,其原理是基于倾向值进行分层,然后计算每一层内项目干预的效应,最后基于每一层的干预效应得到总的干预效应。第一步,根据估计的倾向值e(Xi)对数据进行排序。第二步,使用分位数法基于e(Xi)将样本区分成若干层,通常分为4或5等份。第三步,在每层内进行独立的匹配,计算干预组与对照组成员的平均值,其差即为该层内的平均干预效应ATE,并得到各均值方差估计。第四步,将每层估计得到的平均干预效应加权平均后,得到总的平均干预效应。用数学式表示为:

4.内核匹配

内核匹配通过核函数来调整权重,使用权重wi,j调整所匹配到干预组样本的对照组样本,目的是更加合理地调整每个对照组样本与任一干预组样本之间的距离(Heckman et al.,1997;Heckman et al.,1998)。常见的核函数包括Tricube kernel、Gaussian kernel、Rectangular kernel、Epanechnikov kernel。作为非参数方法,具有不丢失样本个体的优势。虽然核函数和宽带参数会影响到最终的干预效应,但有研究表明(Smith and Todd,2005),处理效应对于核函数和宽带参数的选择并不敏感。权重数学公式表达为:

其中,ei为干预组成员的倾向值,ej为对照组成员的倾向值,K(·)表示内核密度函数,an为带宽(bandwith),用于确定包含周围多大比例的案例。

目前为止,尚无确定的标准用来指导具体研究实践中如何选择不同匹配方法。也没有研究表明,哪种匹配方法就是最优的。相反,不同的匹配方法可能会得到不同的结果。因此,共识的做法是在一项研究中采用多个不同匹配方法、同一匹配方法的不同设定,然后对各种情况下得到的结果加以比较,从而揭示估计得到的试验干预的因果效应是否稳健或不稳健。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈