首页 理论教育 因果推断必要的前提假设:SUTVA与因果关系判定

因果推断必要的前提假设:SUTVA与因果关系判定

时间:2023-07-08 理论教育 版权反馈
【摘要】:目前为止,整个反事实的因果分析框架相对而言都是比较容易理解的。具体而言,特定因果关系的成立需要满足四个假设。假设药物的实际作用是将人的精神状态从10分提高到了20分。此时,我们会得到一个结论,这个药可以让人的精神状态提升15分。因为对于B,研究者没有办法区分出来究竟是因为吃药造成的结果,还是因为彼此之间交互影响造成的结果。因此,在作因果推断的时候,SUTVA要求不存在这种相互影响。

因果推断必要的前提假设:SUTVA与因果关系判定

目前为止,整个反事实的因果分析框架相对而言都是比较容易理解的。但是,为了能够确定因果关系,我们面临一个基本的困境:在拿到数据后,要么能知道Yi(1),要么能知道Yi(0),但这两个永远不可能同时知道,此时,我们无法直接计算个体层次的因果效果。为了能够将分析进行下去,我们要做的就是给定一些假设。有了这些假设条件以后,就能继续推算因果关系。但是如果没有这些假设,因果分析就到此为止,没有办法再进行下去了。

具体而言,特定因果关系的成立需要满足四个假设。我们先将其列举出来,后面阐述其意义。

假设一:单位处理变量值稳定假设

(stable unit treatment value assumption,简称为SUTVA)

假设二:一致性假设(consistency)

假设三:可忽略性假设(ignorability)

假设四:正值假设(positivity)

单位处理变量值稳定假设听起来比较拗口。从本质上讲,这个假设的意思是,被研究对象所接受的处理变量的性质是固定的。那么,什么是性质固定呢?具体展开有两个意思。一个意思就是说,我们所关心的处理变量的性质在不同对象之间不存在互相影响。举个例子,两个人同样上了大学,张三上大学以后他的收入的提升和李四上大学以后收入的提升,两者之间彼此独立,不能互相影响。正是因为没有个体间的相互作用,我们才会说处理变量的性质是稳定的。当然,这是一个比较理想的状态,尤其对于社会科学研究者而言,假设个体彼此独立似乎难以成立。但是,从因果推断的角度看,这样一个假设还是很有必要的。大家可以想一下,如果个体之间出现了互相影响的话,会出现一个难以分析的状况。比如,一群实验组的病人要检验某种药物的效果。一些人先吃了药,以后精神状态变得更好。另外一些人看到先服药的人吃了药以后的精神状况,就得到一个心理暗示,认为药物和精神状态之间存在正向联系。得到这个心理暗示以后,他们再去吃药,此时对于这些后来吃药的人而言,精神状态是药物效果和心理暗示的叠加。比如,一开始个体A吃了药,他的精神状态从10分提到20分,中间有10分的提升。然后个体B看了A吃了药以后精神状态变好了,他就产生一个心理预期,即认为如果自己吃药的话,精神状态也会提升,在形成预期上正向的心理暗示后,B吃了药。假设药物的实际作用是将人的精神状态从10分提高到了20分。但对于B而言,因为他之前看到A的状态变化,形成心理暗示,那么叠加后B就从10分提高到了30分。如果实验组就只有A、B两个人的话,平均一下他们的得分,一个是提高了10分,一个提高了20分,加起来30分,除以2就是15分。此时,我们会得到一个结论,这个药可以让人的精神状态提升15分。但实际情况是,它只有10分的功效。之所以得到一个错误的结论,是因为B受到了A的影响,他看到A吃了药以后提升10分,他自己觉得我肯定也行,那这样一个“我也行”的感觉,又给了他10分的提升,这种心理暗示的10分加上吃药的10分,B就提升了20分,即从10分到了30分。

就这个例子而言,最大的问题在于,不知道B提升的这20分里面究竟有多少分是因为药物使然,多少分是因为心理预期使然。作为一个医生或者是作为一个实验设计者,我们真正看到的事实很简单,就是A吃了药以后精神状态提升10分,B吃了药以后精神状态提升20分。这时候对于B而言,通常研究者会“想当然地”认为这20分完全是因为吃药造成的。实际上却不是这样,因为这个药对于B来讲也只是提升10分的功效。我们甚至可以假想到更加极端的情况,即,有可能这个药对B没有任何效果,他完全是因为自我心理暗示才能提升20分的。那么,我们无形中极大地夸大了药物的效果。

综上所述,在存在个体之间彼此影响的情况下,可以说,上面例子中B所提供的信息基本上是无用的。因为对于B,研究者没有办法区分出来究竟是因为吃药造成的结果,还是因为彼此之间交互影响造成的结果。这两个之间是混在一起的,没有办法严格分开。因此,在作因果推断的时候,SUTVA要求不存在这种相互影响。归根究底,一旦有相互影响,相当于把一些新的混淆因素引入进来,因果关系就会受到“污染”。

SUTVA的假设第二个意思是处理变量没有版本的差异。这个假设还是很好理解的。同样的处理变量,对张三是怎么样的,对李四也应如此。还是以吃药为例。没有版本的差异要求给不同病人所服用的药是一样的。医生给A吃的药是含50%有效成分的药,那么给B的也应当是这种药。如果有版本差异的话,因果关系的推论也会出现问题。比如,A吃了药精神状态提升了10分,B吃了药,状态也提升了10分。但是如果研究者给他们的药根本不一样,给A的药里面有效成分是c1,给B的药里面有效成分是c2。在A那里,c1提升精神状态10分,在B那里c2提升精神状态10分。这个表面上看到的“药”的药效究竟是多少呢?我们是没有办法判断的,因为说到底给不同病人吃的是两种药,成分不同,从而有了版本差异,故而我们是没有办法确定药效的。对于版本差异,另外一个常见的例子是考试。比如,我们想知道一批学生高等数学的成绩是多少。结果在考试的时候分发了不同版本的试卷。虽然试卷的主题都叫高等数学,但一些人的问题是关于微积分的,另外一些人的问题是关于线性代数的。这时候两拨人成绩不一样的话,是否我们就能认为分数高的就比分数低的数学能力更高呢?严格来讲是不可以的。因为他们的试卷根本就不一样,我们怎么能判断他们高等数学水平高低呢?所以说,在进行因果关系分析的时候,我们所关注的那个处理变量一定不能够有不同的版本,否则我们的处理变量本身就难以定义,进而出现分析上的困境。

因果推断的第二个假设叫一致性假设。这个假设很容易理解。正如上文所述,每个个体都有两个看不到的状态:Y(1)和Y(0)。但是如果这个人接受了某一个处理变量影响的话,那么它的观测值就等于它潜在的看不到的那个值。比如,每个人的收入都有两种情况,一个是没有上大学情况下的收入,一个是上了大学后的收入,但是二者都是潜在的未观测状态。此时,如果一个人真的上了大学并获取收入,那么这个人的潜在的上了大学后的收入就等于他真正上了大学后的收入。用上面的符号表示,有

同理,没有上大学情况下的收入就等于真的在没有上大学的现实状况下的收入,即

当然,这里只是一个假设,我们实际上并没有办法去证实或者证伪上述的条件是否成立,毕竟我们永远不可能同时知道Y(1)和Y(0)的取值。因此,我们只能设定一些假设。(www.xing528.com)

因果推断的第三个假设比较重要,叫可忽略性假设。这个假设最基本的要求是,一个人接受处理变量影响(究竟是进入实验组还是控制组)是个随机事件,和潜在的看不到的Y(0)和Y(1)都没关系。用公式表示:

这个假设之所以重要,是因为如果Y(1)和Y(0)和D不独立的话,我们计算的因果关系就会有系统性的偏差。例如,所谓的不独立的情况,是指对于D=1和D=0的两种情况下,Y(1)和Y(0)会发生系统变化。我们可以假设,在可忽略性假设满足的情况下,无论是D=1还是D=0,Y(1)=5,Y(0)=3,则平均因果关系ATE的估计值为如果可忽略性假设不满足,在D=1时,Y(1)=10,Y(0)=4,而在D=0时,Y(1)=3,Y(0)=0。此时,我们估计的平均因果效果就变成了

在社会科学研究中,可忽略性假设直接决定了是否有混淆性偏误。所谓混淆性偏误是指,已知有一些因素决定个体进入实验组还是控制组有不同的概率,同时也决定了Y的取值。例如,对于医学研究而言,很多时候,病人进入特定研究之前的健康状况决定了是否能够进入实验组(D是否等于1),同时,已有的健康状况也决定了个人服药以后的表现,即Y(1)和Y(0)的可能取值(这是基于一致性假设)。那么,在不考虑已有的健康状况的情况下,D和Y(1)、Y(0)之间就是有关系的。假设之前健康状态差的人更容易进入实验组去试药,同时这些人因为自身身体状态不好,吃药以后很容易就提升了相关症状上的表现(类似于边际效用递减),则Y(1)-Y(0)取值偏大。此时,那些更容易表现出很高因果效果的人更容易去参加实验组,这相当于无形中夸大了药效。如果将这里的逻辑转移到大学回报上,一个类似的情形是,那些特别容易从大学文凭中获益的人更加容易上大学。此时大学的经济回报会被夸大了(也就是所谓的,能挣钱的都去上大学,显得上大学的能挣钱)。

那么,如何保证可忽略性假设成立呢?一个办法就是我们接下来会讲到的随机实验。大家可以先想一想,如果在上面讲到的吃药的例子中,是否吃药的分配是用甩硬币的方式决定的,正面的话给某个个体吃药从而进入实验组,反面的话就不给吃药从而进入控制组。个体吃药和不吃药的状态完全取决于扔硬币的结果。由于单独每一次扔硬币的时候,究竟出现正面还是反面我们并不知道,这既不是病人决定的,也不是医生决定的,它就是一个随机现象了。此时,D的取值也就是一个随机现象,自然和Y(1)、Y(0)独立了。

当然,像通过扔硬币决定处理变量取值的安排是很少见的[1]。因为这本质上是随机实验的一种。而对于大多数社会科学研究而言,我们所从事的都是观测性研究(observational studies)[2]。此时,基本上都不太能够利用随机实验的方式满足可忽略性假设。正是因为如此,后面我们要讲的很多具体的方法,比如回归断点设计、匹配方法、倾向值方法等,都是希望能够通过某种统计操作或者设计,让观测性研究非常接近随机实验,尽可能将我们关心的处理变量转化成一个随机现象,亦即尽可能做得像随机实验。总而言之,可忽略性假设是一个很重要的假设。如果没有这条假设的话,我们得到的因果关系都是有可能受到质疑的。

第四条假设是正值假设。所谓正值,是指每个被研究对象接受处理变量特定取值的概率都在0到1之间,但是不能无限接近于0,也不能无限接近于1。这和一般的对于概率的定义不同。对于一般的随机事件而言,其发生的概率有可能是0,也有可能是1,因此它是一个闭区间。但是正值假设要求的是对象接受处理变量影响的概率是一个开区间。如果用p来表示个体接受处理变量(特定水平)影响的概率,那么正值假设可以表示为

本质上讲,正值假设要排除两类分析对象,即p=1和p=0的人。为什么要排除这些人呢?道理实际上很简单,因为这些人太特别了,就算把这些人纳入分析样本中,也无法对因果推论提供太多的帮助。相反,将这些人考虑进去还有可能带来因果分析估计中的偏误。例如,一项研究希望了解进入特定大学A对于收入的影响?如果样本中有一个进入A大学的概率p等于0的人,说明这个人永远不可能进入大学A学习。此时,研究者再去问这个人进入大学A之后收入能提高多少就没有什么意义了。这就类似于去问一个男性,如果他怀孕了,精神状态是不是受到影响一个道理。对于他而言,是不可能接受这个处理变量影响的,因此p永远是0。这时再去评估针对此人的因果效果,是没有意义的。同理,还有一些人的p=1,这些人可以被认为是天生注定一定要接受处理变量的特定水平影响的。对于他们,你根本不可能想象这种人没有接受干预的情况下会在Y上有什么表现。例如,生活与一个国家中的个体,很难设想如果他们一开始出生在另外一个国家,会在Y上有什么表现。也就是说,对于具有特定社会特征的个体,我们很难考察他们置换到另外一种情境下的状态。他们会被如此强烈地固定在处理变量的某个选项下(p=1),以至于我们几乎不能够去假想他们如果在处理变量的另外一个选项下作何表现。

那么从正值假设出发,什么样的研究对象比较适合用来作因果推断呢?答案是,这些研究对象接受干预的概率可能高可能低,但至少是既有可能接受处理变量的某个选项,也有可能不接受这个选项的影响。换句话说,在二分处理变量的情境下,合格的研究对象即可能进入实验组,也可能进入控制组。这样的话,研究者至少能够想象出来每一个人的反事实状态。还是以上大学为例,通常一些高中生会在高考前去心仪的某高校参观,说将来进了这个大学的话,会如何如何。那么此时,这些高中生会因为未来学业表现存在两个潜在的可能性,他们有可能进入这个高校,也有可能没进入这个高校,这些人就是很好的研究对象。但是那些已经保送进某大学的人就不是很好的分析对象了。因为如果我们问这些人如果他没有能够进入某大学的话会怎么样,就显得不是很恰当,因为这些人进入该大学学习的概率基本上是1了。

需要说明的是,当一项研究同时满足正值假设和可忽略性假设时,我们也称其满足“强”可忽略性假设。

以上就是因果推论的四个基本假设。之所以说是基本假设,是因为这四条假设是作因果推断必须要满足的。如果一项研究不能够同时满足这四条假设,那么这个研究会受到很大的方法论质疑。为了凸显这些假设的重要性,我们回到一开始提到的因果推断的基本困难,即我们没有办法同时知道被研究对象的两种潜在状态Y(1)和Y(0),那么加了以上的假设以后是不是对我们有帮助了呢?答案是肯定的。

读者可以看一下表达式E[Y(1)|X],其中X是一系列的控制变量,在给定了X以后,我们想知道样本中的所有人如果上了大学以后他们的平均收入Y(D=1)是什么样的,其中E为取期望值的意思。当然,这个表达式不能直接计算,因为我们不知道每个人的Y(1)状态。基于上述可忽略性假设,可以发现,处理变量和Y(D=1)是彼此独立的,所以在计算的时候,可以把D加上,而不干扰Y(D=1)的取值。所以有E[Y(1)|X]=E[Y(1)|X,D=1]。当我们把D加在后面以后,基于一致性的假设,有E[Y(1)|D=1]=E[Y|D=1],所以,E[Y(1)|X,D=1]=E[Y|X,D=1]。这里,E[Y|X,D=1]就变成了可直接观测到的一个量,即D=1且X等于特定取值的Y的期望值。如果我们希望进一步知道E[Y(1)],就可以对E[Y|X,D=1]求针对X的积分,即。同理,我们也可以计算E[Y(0)],从而进一步估计因果效果,这些计算过程总结如下:

回顾上面的计算过程可以发现,基于统计因果推论的假设,可以将没有办法直接观测到的Y(1)和Y(0)转化为能够直接观测到的Y|D=1和Y|D=0。通过这种转化,研究者就能够用手中的资料,去估算研究者不能经验观察的潜在信息。因此,统计因果推论的假设非常重要,如果没有这些假设,或者假设不成立,一项经验研究的因果推论没有办法进一步往前推进,而只是停留在了思想实验的阶段。实际上,上述的这四个假设并不是孤立存在的。等到后面章节讲到具体的因果推论方法的时候,我们还会时不时地回到这四个假设,审视一下这些假设是不是成立。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈