首页 理论教育 模型构建和估计方法优化

模型构建和估计方法优化

时间:2023-06-12 理论教育 版权反馈
【摘要】:Policy表示开发区政策哑变量,HMS和FMS分别表示国内市场规模和外部市场规模。因此,在随机分组情况下,只需计算样本中实验组和控制组的TFP差异,就可以得到一致估计平均处理效应。在给定协变量的情况下,TFP完全独立于政策变量,则可以认为模型满足“可忽略性”假定。此时对处理组和控制组的相似个体进行估计,可以得到较为一致的估计结果。

模型构建和估计方法优化

1.模型设定

本章研究的是开发区政策、市场规模对企业生产率的影响,其中企业生产率通过企业全要素生产率表征。首先分析开发区政策对全要素生产率的影响;其次分析开发区政策与市场规模之间是否存在交互效应。因此,首先设定了仅包含开发区政策哑变量为解释变量的估计模型(1);其次进一步构建估计模型(2),即在模型(1)的基础上分别引入开发区与外部市场规模和国内市场规模的交互项,以考察伴随着市场规模扩大,开发区政策效应是否发生变化:

其中,TFP表示企业全要素生产率,本章分别应用五种方法对中国工业企业的TFP进行估计,在研究中以OP法估计的TFP为主,同时分别使用LP法和GMM法两种方法的TFP估计结果进行稳健性分析。Policy表示开发区政策哑变量,HMS和FMS分别表示国内市场规模和外部市场规模。Controls表示一组可能影响企业TFP的控制变量集,包括外资参与程度(FDI)、人力资本水平(HC)、资本密集度(CI)、企业年龄(Age)、行业垄断程度(HHI)、国有企业哑变量(SOE)、创新型企业哑变量(RD)和出口企业哑变量(EX)。此外,为了尽可能解决随个体而异的遗漏变量问题以及随时间而变的遗漏变量问题,本章还构建了31个省(市区)(具体省份见前文)的地区虚拟变量(Dum_prov)、两位数行业虚拟变量(Dum_cic)和年份虚拟变量(Dum_year)。其中,地区虚拟变量可以控制省份个体特征差异对估计结果的影响,行业虚拟变量可以控制行业特征差异的影响,用年份虚拟变量来控制全国宏观经济发展环境的影响。

2.估计方法

本章中开发区政策对企业生产率的影响研究分两步进行。

首先,使用普通面板数据模型的混合回归、固定效应和随机效应模型进行估计,作为政策效应的基准分析,并通过hausman检验来选择是使用固定效应模型还是随机效应模型,并在估计时引进个体固定效应和时间固定效应,尽可能解决不随个体而异和不随时间而变的遗漏变量问题(详细说明见第四章)。

其次,用倾向匹配评分(PSM)方法评估开发区的政策效应。在经济学中,评估某项政策实施后的效果,这种政策效应被称为“处理效应”(treatment effect)。享受政策的企业构成“处理组”,而未享受政策的企业则构成“控制组”。是否进入开发区是企业自我选择(self selection)的结果,进入开发区意味着企业能够获得开发区政策支持,比如税收减免、避免进出口税额限制等。此外,处理组和控制组的企业样本的初始条件不完全相同,故存在“选择偏差”。而本章关注的“处理效应”是实验组得到开发区政策支持的企业全要素生产率是否会比假如没有开发区政策支持的企业全要素生产率高。(www.xing528.com)

因为企业无法同时进入开发区,无法解决企业样本选择问题,为此,Rubin(1974[134])提出了“反事实框架”,称为“鲁宾因果模型”(RCM)。用虚拟变量Di表示个体i是否参加项目,0为参与,1为未参与。那么,对于个体i的未来收入就取决于是否参加此项目,即:

其中,y1i表示个体i参与项目的未来收入,而y0i表示个体i没有参与项目的未来收入。那么,个体i参与项目的处理效应,即实际参与者的平均处理效应(ATT),即:

ATT≡E(y1i-y0i|Di=1)

对于政策制定者,ATT是至关重要的,因为它衡量的是项目参与者的毛收益。ATT也是本章所关注的重点问题,即进入开发区后企业的TFP是否有提高。因为同一企业没办法同时观测到进入开发区和没有进入开发区企业未来的TFP结果,所以如果简单比较处理组和控制组的TFP差异会导致样本选择偏差,企业是否进入开发区的TFP差异表现为:

上式中,等号左侧表示未进入开发区企业和进入开发区企业的平均差异,等号右侧第一项表示政策参与企业的平均处理效应(ATT),第二项表示样本选择偏差。样本选择问题通常不考虑政策效应,故个体间的差异并不在于是否得到处理,而在于被解释变量是否可观测,通常D=1意味着被解释变量可观测,而D=0意味着被解释变量不可观测。而处理效应模型中,无论D等于1还是0,结果变量均可观测。样本选择难题并非不可克服,通过随机分组可以解决,当进入开发区与否是由电脑随机数决定时,政策变量就与未来企业平均TFP完全独立。因此,在随机分组情况下,只需计算样本中实验组和控制组的TFP差异,就可以得到一致估计平均处理效应。然而,随机分组并非完全可行,随机分组也能带来高额成本。企业是否进入开发区,可能受到多种可测变量和不可测变量的影响。实证中将这种影响企业选择的可测变量集称为“协变量”。在给定协变量的情况下,TFP完全独立于政策变量,则可以认为模型满足“可忽略性”假定。而匹配估计量的基本思路就是假设个体i属于处理组,只要找到属于控制组中的某个个体j,使得两个个体的可测变量取值尽可能相似匹配。此时对处理组和控制组的相似个体进行估计,可以得到较为一致的估计结果。而倾向得分匹配(PSM)是将倾向得分作为距离函数进行匹配,匹配方法包括最近邻匹配、核匹配、半径匹配。本章在PSM分析部分采取的是最近邻匹配原则来评估开发区的政策效应。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈