首页 理论教育 数据来源和统计方法的选择与应用

数据来源和统计方法的选择与应用

时间:2023-06-08 理论教育 版权反馈
【摘要】:各行业进出口额和进口价格数据主要来自联合国UN comtrade数据库,也使用上述方法进行集结和转换。上市公司的慈善捐献和管理费数据来自CSMAR国泰安数据库和Wind数据库,上市公司按照中国证监会网站公布的《2012年4季度上市公司行业分类结果》进行行业分类和数据集结。行业产值、行业利税总额,资产总额和就业人数数据来自2004—2012年《中国统计年鉴》。科技人员数量数据来自2004—2012年《中国科技统计年鉴》。

数据来源和统计方法的选择与应用

本书研究样本是2004—2012年按照中国工业行业分类(CICC)的36个工业行业。之所以选择2004—2012年作为研究区间,首先是因为对于第十届和第十一届全国人大代表、全国政协委员以及相关官员而言,2004—2012年的时间区间正好是第十届、第十一届全国人大代表、全国政协委员、国务委员以及第十六届、第十七届中共中央政治局委员的就职时间;其次是因为国泰安数据库(CSMAR)和万德数据库(Wind)从2004年开始才有较为完整和可信管理费和企业慈善捐献记录。这些记录来自财务报表以及财务报表附注中。名义关税率数据来自World Bank的TRAIN数据库,该数据库是按照协调制度八位编码(HS2002)公布名义关税率,依据联合国统计署网站发布的HS(2002)—ISIC(Rev.3.1)转换表转换成按照工业标准分类(ISIC)的行业中,由于ISIC上的行业划分本身就依据了中国国家统计局提交的CICC标准,因此最终获得CICC标准下36个行业的关税税率[6]。转换过程中均使用加权平均的方法进行处理。

各行业进出口额和进口价格数据主要来自联合国UN comtrade数据库,也使用上述方法进行集结和转换。上市公司的慈善捐献和管理费数据来自CSMAR国泰安数据库和Wind数据库,上市公司按照中国证监会网站公布的《2012年4季度上市公司行业分类结果》进行行业分类和数据集结。行业产值、行业利税总额,资产总额和就业人数数据来自2004—2012年《中国统计年鉴》。行业平均工资数据来自2004—2012年《中国劳动统计年鉴》。科技人员数量数据来自2004—2012年《中国科技统计年鉴》。(www.xing528.com)

本书的数据属于时间跨度较小而横截面观察点较多的面板数据,因此要考虑到该数据的截面相关性。经过检验未发现显著的截面相关性。不过,在回归过程中仍旧使用Huber-White稳健标准误进行调整。经过Huasman检验后,最终使用年度控制变量的固定效应模型,并针对内生性采用2SLS工具变量法进行回归。连续变量均在前后1%的水平上进行了winsorize处理。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈