首页 理论教育 倾向值概念解析-多元统计与SAS

倾向值概念解析-多元统计与SAS

时间:2023-10-30 理论教育 版权反馈
【摘要】:倾向值e被定义为给定观测特征向量的条件下,个体i受到项目干预的条件概率,以数学表达式为:可以看出,倾向值匹配的优点在于当Xi包括不止一个共变量时,倾向值e可以将所涉及的多维观测特征简化为一个一维的概率值。Rosenbaum&Rubin建议用预测概率的Logit作为估计的倾向值。用数学公式表达为:Rosenbaum&Rubin证明了在具备某些假定的情况下,基于倾向值e的匹配与基于X的匹配一样好。

倾向值概念解析-多元统计与SAS

倾向值e(Xi)被定义为给定观测特征向量(X=Xi)的条件下,个体i受到项目干预(Ti=1)的条件概率(Rosenbaum&Rubin,1983),以数学表达式为:

可以看出,倾向值匹配的优点在于当Xi包括不止一个共变量时,倾向值e(Xi)可以将所涉及的多维观测特征简化为一个一维的概率值。在以往的匹配中,随着匹配变量数量的增加,面临着从对照组中为某一既定干预组成员找到一个好的匹配这一困难。而倾向值作为一个平衡量度,相比于每个共变量X而言,它是最粗略的,但却包含对多个共变量信息的概括。之所以说是粗略的是因为倾向值虽然是一个简单的一维概率值,它却可以平衡干预组和对照组间可观察到共变量Xi的差异。

估计倾向值的方法有Logistic回归、Probit模型、鉴别分析(discriminant analysis),但常用的是Logistic回归。Rosenbaum&Rubin(1985)建议用预测概率的Logit作为估计的倾向值。用数学公式表达为:

Rosenbaum&Rubin(1983)证明了在具备某些假定的情况下,基于倾向值e(Xi)的匹配与基于X的匹配一样好。因此我们在进行倾向值评分匹配时需要满足以下假定,对此进行检验。

1.条件独立假定

条件独立假定是指给定不受试验干预影响的一组可观测特征X的情况下,潜在结果Y独立于干预分派T,也就是说,未观测到的因素不会影响到干预,用数学公式表达如下:(www.xing528.com)

条件独立性属于强假定,但不能直接加以检验。该假定取决于项目本身的具体特征,若未被观测到特征决定着项目参与,条件独立性将被违背,倾向值评分匹配就不是一个恰当的方法。

2.共同支持域假定

共同支持域假定确保干预组成员能找到处于倾向值分布附近的对照组成员。对于每个X值,既有已处理的观测值,也有对照的观测值。用数学公式表达为:

倾向值评分匹配的效率取决于是否有大量干预组和对照组成员,以便能找到够大的支持域,此外如果不存在相似的对照组成员,有些干预组成员可能会丢失,从而引入因果效应的抽样偏差(sampling bias)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈