Shipley的观点基于所谓的有向无环图(Directed Acyclic Graph,DAG),即如上所述的路径图结构类型,如果两个变量之间有箭头,则认为它们是因果相关的,如果它们之间没有箭头,则是因果独立的,考虑以下示例:
x1直接独立于y2,归因于它们之间没有箭头。
但是,y2可能通过y1而被x1间接影响,因此x1独立于y2的条件取决于y1。这是一个重要的区别,因为它暗示了我们必须测试x1和y2之间缺失的箭头是否重要。
这种情况下,常使用有向分离(简称D分离)在控制变量路径的条件下,测试因果独立的路径是否有意义。该测试可发现在既定模型中是否缺失某些(直接)路径以及是否需要在改进模型时将缺失的路径考虑进来。
首先,列出所有没有(直接)箭头的变量对,然后列出所有可能他介导变量对的变量,这些独立声明对及其条件变量构成基础集。对于上述DAG,获得的基础集包括:(www.xing528.com)
然后可以将基础集转换为一系列线性模型,将条件变量(y1和y2)作为协变量考虑在内,目的是关注DAG中可能缺失的直接路径(例如x1~y2)。
在控制y1或y2的条件下,分别运行这些模型,并提取与缺失直接路径相关的p值,并根据p值计算Fisher’s C统计量:
Fisher’s C统计量遵循具有2k个自由度的卡方分布(其中k=基础集中变量对的数量)。如果对其进行卡方检验并且检验获得的p<0.05,则该模型拟合不是很好,换句话说,变量对中存在一个或多个缺失的直接路径是有意义的,可能还需将它们加入到模型中进行优化;相反,如果p>0.05,则该模型可以很好地表示数据,原模型中已经识别所有有效路径,没有遗漏的路径。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。