首页 理论教育 变量选择机制在建立经济学回归模型中的应用

变量选择机制在建立经济学回归模型中的应用

时间:2023-06-11 理论教育 版权反馈
【摘要】:变量选择是统计学研究中的热点和难点,并且将该方法应用于经济学分析具有重要意义。此外,在建立回归模型时,部分自变量对因变量的影响并不显著。因此,在建模时应引入变量选择机制对自变量进行筛选、剔除不显著的变量,从而改善模型的拟合效果,增加模型的预测精度。一般而言,OLS得到的估计偏差通常较小,但方差较大,从而导致预测精度不够。

变量选择机制在建立经济学回归模型中的应用

变量选择是统计学研究中的热点和难点,并且将该方法应用于经济学分析具有重要意义。在经济学研究中,对因变量有影响的因素众多,在单一的模型中难以刻画所有因素与因变量之间的关系。此外,在建立回归模型时,部分自变量对因变量的影响并不显著。因此,在建模时应引入变量选择机制对自变量进行筛选、剔除不显著的变量,从而改善模型的拟合效果,增加模型的预测精度。

研究中常用的线性模型的一般形式为:

其中Y是因变量,X=(X1,X2,…,Xp)′为自变量,β=(β1,β2,…,βp)′是未知参数向量,ε是误差项。β可以通过最小二乘法(OLS)估计得到,即最小化:

然而,在进行OLS估计时,常常会遇到以下两个问题:首先,是预测精度不高。一般而言,OLS得到的估计偏差通常较小,但方差较大,从而导致预测精度不够。其次,是解释力不足。OLS不能压缩变量,即输入多少变量,输出仍是这些变量。在实际中,有时更希望将那些对因变量影响较小的变量剔除,仅留下核心变量进入模型,从而增加模式的解释力。最优子集和岭回归方法是经典回归理论中经常被使用的两种方法,但最优子集的估计结果不稳定,原始数据出现微小变化会导致估计结果产生较大波动;岭回归虽然比较稳定,但并不能实现选择变量的目的。基于Tibshirani、Fan和Li[20-21]的研究,LASSO和SCAD方法是通过对参数进行惩罚,将接近于零的参数压缩为零,从而将那些对因变量影响较弱的自变量剔除,达到变量选择的目的。其原理是:(www.xing528.com)

其中f(·)是罚函数。对于LASSO方法,罚函数为f(u)=λ|u|;对于SCAD方法,罚函数为,其中γ>2,(a+aI(a≥0))。Fan和Li建议取γ=3.7。λ是调节参数,其取值可以通过AIC、BIC和交叉验证等方法进行选取。

LASSO和SCAD方法不仅可以估计变量参数,同时可以进行变量选择,从而可以解决一般的OLS估计面临的两个问题,梁斌等[22]的研究验证了LASSO和SCAD方法应用于中国经济中的可行性。

本文使用LASSO和SCAD方法分析财险市场集中度问题,据此在谭毅等、袁缘等、Wolf、孙洪哲和刘琦、颜银根[9-10,17-19]等学者的研究基础上选择影响财险市场集中度的主要变量,进而根据实证结果探讨优化财险市场集中水平的方案。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈