根据本章的研究内容,研究所需的数据总体上包括以下三类:第一类是时间序列数据,包括中国与17 个贸易对象国的双边贸易额、体现一国的综合经济规模的相关宏观数据;第二类是非时间序列数据,包括17 国的语言各自与汉语普通话的语言距离和17 个贸易对象国各自与中国的地理距离;第三类是虚拟变量,包括共同边界变量和经贸合作安排变量。各个变量数据的具体来源是:
(1)模型的因变量TRADE 是2005—2014年中国与17 个贸易对象国的年度双边货物贸易总额,该变量的数据全部来自中华人民共和国国家统计局的国家数据(http://data.stats.gov.cn),“国家数据”的年度数据中对中国对外经济贸易的货物进出口额度进行了分国家(或地区)的详细统计。由于中国的服务贸易起步较晚等众多因素,国家统计局并没有中国与世界各国(或地区)有关服务贸易的年度数据,所以本章的因变量选择的是中国与所选17 个对象国的货物贸易流量数据。
(2)自变量GDP1 和GDP2 来自世界银行数据库的各国经济发展统计(http://data.worldbank.org)。
(3)自变量DIS(地理距离)数据来自“CEPII 数据库”中的GEOGRAPHY的各国距离统计数据,该统计包含了世界上225 个国家双边的多项数据,如地理距离、共同边界、共同语言等(http://www.cepii.fr/CEPII/en/bdd_modele/bdd.asp)。
(4)自变量LAN(语言距离),前面已经对WALS 的语言距离测量方法进行了简单的介绍,本章中对中国的普通话和17 个贸易对象国的语言距离计算的方法是:对每个语言对的100 多个具体语言特征逐一进行比较,相同者记为0,不同者记为1,然后对统计结果求和,求和所得数字反映该语言对的语言差异程度,记为该语言对的语言距离。统计结果见表6−3。(www.xing528.com)
表6−3 17 国语言与中国普通话的语言距离
(5)虚拟变量RTA 主要根据世界贸易组织RTA 数据库(http://rtais.wto.org/UI/PublicMaintainRTAHome.aspx)和中华人民共和国商务部多双边经贸合作安排进行统计(http://www.mofcom.gov.cn/mofcom/dsb.shtml)。
(6)虚拟变量ADJ(共同边界),数据来源于世界地图(http://www.sinomaps.com),该变量主要考虑陆地边界。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。