【摘要】:Logistic回归模型的参数估计通常采用的是最大似然估计法,其优点是适用范围广,不要求自变量呈多元正态分布,其基本思想是对n例观察样本建立似然函数L:上述公式中Pi表示第i例观察对象在自变量的作用下阳性结果发生的概率,如果实际出现的是阳性结果,取Yi=l,否则取Yi=0。此时,求似然函数达到极大时的参数取值。
Logistic回归模型的参数估计通常采用的是最大似然估计法(maximum likelihood estimation,MEL),其优点是适用范围广,不要求自变量呈多元正态分布,其基本思想是对n例观察样本建立似然函数L:
上述公式中Pi表示第i例观察对象在自变量的作用下阳性结果发生的概率,如果实际出现的是阳性结果,取Yi=l,否则取Yi=0。然后根据最大似然原理:在一次抽样中获得现有样本的概率应该最大,即似然函数L应该达到最大值。此时,求似然函数达到极大时的参数取值。但是使似然函数取最大值的过程是十分困难的,为简化计算,通常取似然函数的对数形式:
上述方程的求解常常依靠统计软件完成,依赖于SAS软件,我们可以得到使这一似然函数达到最大值的参数估计。(www.xing528.com)
在样本量较大的情况下,Logistic回归的最大似然估计逐渐向真值靠拢,估计可以被看作近似无偏的,此时参数估计的标准误也会相应的缩小,并且最大似然函数估计值分布趋近于正态分布,因此我们可以进行研究假设的显著性检验和参数置信区间的计算。但是Logistic回归的最大似然估计的这些优点在样本较大时才会出现,当面对小样本时,最大似然估计的风险可能较大,解释概率估计值和相应的置信区间应当十分谨慎。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。