数据从不同的角度有不同的分类方式,下面介绍按照计量尺度、数据的收集方法和数据在时间上的表现来划分的不同类型。
1.按照计量尺度分类
①品质型数据(qualitative data)也称定性数据,是用以说明事物的品质特征的数据,一般为非数值型数据,只能用文字表述。这类数据是由定类尺度和定序尺度计量形成的,又可细分为分类数据和顺序数据。
a.分类数据(categorical data)是只能归于某一类别的非数值型数据,为定类尺度计量数据,它是对对象进行分类的结果,数据表现为类别。例如,人口可按照性别分为男、女两类。
b.顺序数据(rank data)是只能归于某一有序类别的非数值型数据,为定序尺度计量数据。顺序数据既可以划分为类别,也可以进行排序。例如,考试成绩可以分为优、良、中、及格和不及格等。
②数值型数据(quantitative data)也称定量数据,是用以说明现象的数量特征的数据,具体表现为数值。这类数据是由定距尺度和定比尺度计量形成的。例如,人的身高、体重、年龄等均为数值型数据。
2.按照统计数据的收集方法分类
①观测数据(observational data)是指通过调查或观测而收集到的数据。这类数据是在没有对对象实施人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据,如消费者对产品偏好研究的调查数据、居民人均收入数据等。(www.xing528.com)
②实验数据(experimental data)是指在实验中控制实验对象而收集到的数据。自然科学和工程领域的多数数据都是实验数据,如关于一种新药疗效的实验数据、关于一种新的农作物品种的实验数据。
3.按照被描述的现象与时间的关系分类
①截面数据(cross-sectional data)是在相同或相近的时间点上收集到的数据,这类数据通常是在不同空间上获得的,用于描述现象在某一时间的变化情况。例如,2015年我国各省份的GDP数据就是截面数据。
②时间序列数据(time series data)是在不同的时间点上收集到的数据,这类数据是按时间顺序收集的,用于描述现象随时间变化的情况。例如,2000—2015年北京市GDP数据就是时间序列数据。
区分数据的类型是非常重要的,因为对于不同类型的数据,需要采用不同的统计方法来进行处理和分析。例如,对于分类数据,通常计算各类的频数或频率、计算其众数、进行列联分析和拟合优度检验等;对于顺序数据,除了可以采用以上分类数据的统计分析方法外,还可以计算其中位数、计算等级相关系数等;对于数值型数据,可以运用更多的统计方法进行分析,如计算各种统计量,进行参数估计、假设检验和方差分析等。图1.3所示为统计数据的分类图,可方便读者直观地理解统计数据的分类。
图1.3 统计数据的分类图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。