基本的计数回归模型是Poisson回归模型,通过上一节的介绍我们知道,Poisson回归假设均值与方差相等,即E(Yi)=Var(Yi)。但是在实际许多研究应用中,由于数据的复杂性,这一假设通常并不能得到满足。我们在数据分析处理中常常遇到的情况是方差大于均值,即Var(Yi)>E(Yi),这种分布常被称之为“过大离散”。当数据出现“过大离散”的情况时,如果我们继续使用普通的Poisson回归模型,虽然其回归系数估计仍然是一致的和无偏的,但其标准误会偏小,因此这样会导致统计检验并不准确。
在实际生活中,造成过离散的原因有许多,主要有以下几方面:(1)样本之间存在异质性。(2)个体事件的发生存在相关性。(3)个体事件的发生存在聚集性。(4)遗漏了某些未观察到的变量。(5)由于零计数过多。(www.xing528.com)
在对计数数据进行模型分析时,过离散是很常见的问题,出现过度离散时,虽然我们仍然能得到参数的估计,但存在一些问题,最明显的就是会出现错误的标准误。因此为了修正由过离散所带来的问题,1992年Xue和Deddens提出了负二项回归模型(Xue&Deddens,1992)。该模型适用于因变量Y服从负二项分布的计数资料。所谓负二项分布,是指假设有一组独立的伯努利数列,每次实验有“成功”和“失败”两种结果。如果每次实验成功的概率是P,那么失败的概率就是1-P。通过一系列实验我们会得到一组序列:当预定的“失败”次数达到r次,那么结果为“成功”的随机次数会服从负二项分布X~NB(r;P)。当因变量服从负二项分布时,通常会采用该模型进行统计分析。负二项回归模型作为Poisson回归模型的扩展,它能够容纳比Poisson回归模型更大的变异,更适合于分析过度离散数据。近年来,此模型已广泛应用于多个领域,如计量经济学、生物统计学、兽医流行病学等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。