首页 理论教育 数据搜集的介绍,常见的数据类型

数据搜集的介绍,常见的数据类型

时间:2023-05-25 理论教育 版权反馈
【摘要】:样本数据的收集与整理,是建立计量经济学模型过程中最费时费力的工作,也是对模型质量影响极大的一项工作。(二)样本数据的质量样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性四个方面。计量经济学方法,是从样本数据中寻找经济活动本身客观存在的规律性,如果数据是不可比的,得到的规律性就难以反映实际。

数据搜集的介绍,常见的数据类型

样本数据的收集与整理,是建立计量经济学模型过程中最费时费力的工作,也是对模型质量影响极大的一项工作。从工作程序上讲,它是理论模型建立之后进行的,但实际上经常是同时进行的,因为能否收集到合适的样本观测值是决定变量取舍的主要因素之一。

(一)常见数据类型

1.时间序列数据

时间序列数据是一个统计指标按照时间顺序记录的数据列。时间序列数据可以是时期指标数据,也可以是时点指标数据。

2.截面数据

截面数据是在同一时间不同统计单位的相同统计指标组成的数据列。与时序数据比较,其区别在于组成数据列的各数据的排列标准不同,时序数据是按时间顺序排列,截面数据则是按照统计单位排列的。因此,截面数据不要求统计对象及其范围相同,但要求统计的时间相同,也就是说,必须是同一时间截面上的数据。

3.面板数据

面板数据指的是不同单位、不同时间下某一统计指标测度的结果。从某一单位来看,可以从中抽取出一个时间序列,从某一时间截面来看,是同一时间下不同单位测度的结果,表现为截面数据。(www.xing528.com)

需要说明的是部分教材将虚拟变量数据作为第四种类型也列入常见数据类型中。虚拟变量一般作为定性因素的测量的手段,虚拟变量回归分析一章中会对此有详细解释,虚拟变量测量的结果为虚拟变量数据,教材编写组认为虚拟变量数据既可能是时间序列数据、截面数据,也可能是面板数据,例如探讨改革开放对中国经济发展的影响,如果利用虚拟变量测度改革开放政策,测量结果为一时间序列数据;再例如探索投资政策对地方经济发展的影响,如果用虚拟变量测度投资政策,测度结果为一截面数据。因此,本教材中未将该类数据单独列出。

(二)样本数据的质量

样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性四个方面。

完整性,即模型中包含的所有变量都必须得到相同容量的样本观测值。这既是模型参数估计的需要,也是经济现象本身应该具有的特征。

准确性,有两个方面的含义:一是所得到的数据必须准确反映它所描述的经济因素的状态,即统计数据或调查数据本身是准确的;二是它必须是模型研究中所准确需要的,即满足模型对变量口径的要求。

可比性,也就是通常所说的数据口径问题。人们容易得到的经济统计数据,一般可比性较差,其原因在于统计范围口径的变化和价格口径的变化必须进行处理后才能用于模型参数的估计。计量经济学方法,是从样本数据中寻找经济活动本身客观存在的规律性,如果数据是不可比的,得到的规律性就难以反映实际。

一致性,即总体与样本的一致性。违反一致性的现象经常发生,例如,用企业的数据作为行业生产函数模型的样本数据,用人均收入与消费的数据作为总量消费函数模型的样本数据,用某些省份的数据作为全国总量模型的样本数据,等等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈