Koenker, Bassett(1978)将分位回归的基本思想引入经济学分析。分位回归与线性回归一样,关心的也是因变量y在给定自变量x基础上的条件分布。不同的是线性回归假定条件分布的一个重要特征——条件分布的均值是x的线性函数,即OLS回归试图拟合一个条件期望的线性方程。如果我们考虑的不是y的条件均值,而是条件中位数,并且假定y的条件中位数是x的线性函数,这就是中位数回归,也叫做50%分位回归。原则上讲,我们可以以任何y的条件分布分位数p来代替中位数,构造p分位回归。
基于上述思想,分位回归至少有如下两个优点:首先,通过对不同分位数进行回归,可以对条件分布的不同位置进行分析。在本研究中,给定资源禀赋条件(同时控制其他要素禀赋影响),旅游产业经济绩效的条件分布反映了其他没有被观测到的特征。由于这些特征在一定程度上与资源禀赋存在互补性,我们没有足够的理由要求资源禀赋的影响作用在经济绩效条件分布的不同位置是一样的,分位回归正好可以对条件分布的不同位置进行分析。同时,通过分位回归,我们可以考察是否存在异方差——如果条件分布的形状随着解释变量而变化,不同分位点分位回归的系数也将不同(Koenker, Bassett,1982)。分位回归的另外一个好处在于分位点并不受数据单调变换的影响。其次,和中值对于异常值的敏感程度小于均值一样,分位数对于异常值的敏感程度也远远小于均值。分位回归只受是否存在异常值的影响,而与其具体位置无关(当然是在给定大于还是小于某个分位数的情况下)。因此,分位回归是稳健性质强于OLS的回归技术之一[4]。
分位回归是对中值回归的拓展。中值回归的估计基于这样的想法:如果定义绝对离差为距离的话,中值是距离数据最近的点,即中值最小化绝对离差之和(Least Absolute Distance,LAD)。具体就估计方法来说,其建立在“最小一乘估计(LAE)”思想之上,即:
令Yt和Xt(t=1,2,…,n)分别表示因变量和自变量,n为样本量。假定模型为线性,则构造第θ(0<θ<1)个分位回归的目标函数如下:
Vn(β,θ)=θ|yt-x′tβ|+(1-θ)|yt-x′tβ|
上式是以θ为权重的加权平均绝对误差,估计第θ个分位的参数估计值β^(θ)即对目标函数Vn(β,θ)的最小化。最小化Vn(β,θ)的一阶条件是:
(θ-I{y1-x′tβ<0})=0(www.xing528.com)
其中,I为示性函数(Indicator Function):
I{y1-x′tβ<0}=
利用线性规划方法对一阶条件求解得到分位回归参数估计值β^(θ)。对模型做适当的假设,则可以证明分位回归参数估计值β^(θ)具有一致性(相合性)和渐近正态性,即:
P(β^(θ)-β(θ))=1, (β^(θ)-β(θ))A≈N(0,Λθ)
其中,Λθ=θ(1-θ)(-E[xtx′tfe(θ)|x(0)]-1)E(xtx′t)(-E[xtx′t·fe(θ)|x(0)]-1),fe(θ)|x为误差项的条件概率密度函数。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。