首页 理论教育 多元统计分析中的Poisson回归概述

多元统计分析中的Poisson回归概述

时间:2023-10-30 理论教育 版权反馈
【摘要】:Poisson回归模型假设因变量Y符合一种特殊的概率分布,即Poisson分布。对仅存在两种结果的n次独立重复随机试验,当n很大而指定结果发生的概率P很小,而np适中时,Poisson分布是一个很好的近似。在现实研究中,通常更倾向于通过特征进行判断该数据是否基本服从Poisson分布。当因变量服从Poisson分布时,通常会采用该模型进行统计分析。目前,Poisson回归模型被广泛应用于社会学、经济学、医学、心理学等众多领域。

多元统计分析中的Poisson回归概述

Poisson回归模型假设变量Y符合一种特殊的概率分布,即Poisson分布。Poisson分布由法国著名数学家Siméon-Denis Poisson于1837年提出(夏元睿等,2019),适用于计数数据。对仅存在两种结果的n次独立重复随机试验,当n很大而指定结果发生的概率P很小,而np适中时,Poisson分布是一个很好的近似。Poisson回归是对单位时间或单位空间内某个特定事件发生次数进行分析常用的一种方法,并且在对稀有事件(即小概率事件)出现的概率进行描述时也特别有用,比如10分钟内闯红灯的人数、每10万人中患癌症的人数、在某种液体单位体积中观察到的微生物数目等,这都可以看成服从Poisson分布的随机变量

上述例子中明显的一个特点在于:低概率性,以及单位时间或单位空间内的数量;通常情况下,满足以下三个条件时,则称数据满足Poisson分布,三个条件分别是:

(1)平稳性:这是指事件发生次数的多少只与单位大小有关系(比如以10000为单位,或者10万为单位时患癌症人数不同)。

(2)独立性:这是指事件发生频数的大小,各个数之间没有影响关系,即频数数值彼此独立,没有关联关系(比如前10分钟闯红灯的人多了,后10分钟闯红灯的人数并不会受影响)。

(3)普通性:发生频数足够小,即低概率性。(www.xing528.com)

如果数据符合这类特征时,而此时研究者又想探讨X对Y的影响(Y呈现Poisson分布),此时则应该使用Poisson回归,而不是使用传统的线性回归等。

检验数据是否符合Poisson分布,一般有两种方法:第一种是通过特征判断,即要求数据符合以上提到的三个条件;第二种则是通过Poisson检验,此法可通过相应的软件程序实现。在现实研究中,通常更倾向于通过特征进行判断该数据是否基本服从Poisson分布。

Poisson回归是基于计数变量而建立的回归模型,它是经典线性回归分析的扩展。当因变量服从Poisson分布时,通常会采用该模型进行统计分析。目前,Poisson回归模型被广泛应用于社会学经济学、医学、心理学等众多领域。在当今,许多现实数据服从Poisson分布,因此对Poisson回归模型有必要进行系统的研究。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈