以y表示反应变量,假设反应变量有J种类别,分别以1,2,…,J表示反应变量的J种类别,则y的取值为y=1,y=2,…,y=J。以xk表示第k个解释变量,βk表示xk的系数,k=1,2,…,K,其中,K表示解释变量的总数。类比于线性回归模型,y与xk之间的关系应该是但因为y为分类变量,引入一个连续型反应变量y*,将y*作为建立y与xk关系的“桥梁”。
y*与xk之间存在线性关系:
式中,y*表示观测现象的内在趋势,不能被直接观测;ε为误差项。
y有J种类别,则有J-1个分界点将相邻类别分开,以μ1,μ2,…,μJ-1表示分界点,其中μ1<μ2<…<μJ-1,且通常规定μ1=0。如果y*≤μ1,则y=1;如果μ1<y*≤μ2,则y=2;…;如果y*>μJ-1,则y=J[121]。
根据y*与y之间的关系,y≤j的累积概率P(y≤j)(j=1,2,…,J-1)为:
式中,F为ε的累积分布函数。
让ε服从Logistic分布,Logistic函数为因此,为:(www.xing528.com)
将式(6-3)代入式(6-2),有:
将称为累积发生比,根据式(6-4)和式(6-5),有:
将式(6-6)两边取自然对数,得到有序Logistic回归模型的定义[121-124]:
式中称为累积对数发生比,j=1,2,…,J-1,即共有J-1个方程;β0j表示截距,为待估计参数;βk表示xk的系数,为待估计参数,k=1,2,…,K。
有序Logistic回归的反应变量与解释变量之间是非线性关系,累积对数发生比与解释变量之间是线性关系。
求出有序Logistic回归模型的未知参数β0j和βk后,根据式(6-4)可求出累积概率。属于特定类别的概率P(y=j)便可根据累积概率求出,将P(y=j)简称为Pj,则:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。