在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中,通过给定该种属性的有无,来判断该因素对于被解释变量的影响,通常变化的有无是根据截距项的差值体现出来,但是如果在模型设定中,虚拟变量与其他解释变量中间存在交叉项,则其影响的大小并不是一个固定的数值,而是随着其交叉项解释变量变化而变化的一个数值,读者在实际模型设定中应当根据模型的科学性进行合理设置。
由于定性变量通常表示的是某种特征的有和无,所以将其取值为1或0,0表示未包含该属性,1表示拥有该种因素。这种变量称作虚拟变量,通常用D表示。但是在部分定序数列中,通常根据区间划分,设置多个取值,但其原理与0-1变量类似。
1.截距移动
设有模型,
其中yt,xt为定量变量;D为定性变量。当D=0或1时,上述模型可表达为
图10-1 测量截距不同
D=1或0表示某种特征的有无。反映在数学上是截距不同的两个函数,即拥有该属性的函数表达式的截距项会发生变化,若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。
注意:
①若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap),特别是当使用过多虚拟变量来描述模型时,极易掉入该种陷阱。
②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果,但是在实际设定时,需要明确其表示含义,从而进行对比分析。(www.xing528.com)
③定性变量中取值为0所对应的类别称作基础类别(base category)。
④对于多于两个类别的定性变量,可采用设一个虚拟变量,但是对不同类别采取赋值不同的方法处理。
2.斜率变化
以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需要考虑时,可建立如下模型:
其中xt为定量变量;D为定性变量。当D=0或1时,上述模型可表达为
通过检验β3是否为零,可判断模型斜率是否发生变化。
图10-2 情形1
图10-3 情形2
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。