首页 理论教育 社会统计学:变量层次分析

社会统计学:变量层次分析

时间:2023-08-05 理论教育 版权反馈
【摘要】:1)定类变量定类变量是测量层次最低的变量。问卷中用5 个等级或3个等级进行的态度测量和满意度测量的变量均属于定序变量。根据测量工具是否具有绝对零,尺度变量分为定距变量和定比变量。在社会调查中,使用量表对事物进行测量时,形成的大多是定距变量。例如,从定距变量来看,收入1 000 元与2 000 元之间的差距等于收入8 000 元与9 000元之间的差距。

社会统计学:变量层次分析

通过社会测量可以将社会现象数量化。 但是,测量中使用的测量工具的精细化程度不同,测量结果所形成的变量的层次也不同。 这里所说的测量,其实是对变量进行测量,就是要把变量的“变化”测量出来。 对变量的“变化”的测量涉及两个问题:一是不同类型之间能否排序? 二是不同类型之间的差距能否以有意义的数字形式具体反映出来?对这两个问题的不同回答决定了测量的不同层次。 按照变量的取值特征和统计分析时方法应用的特征,变量可以划分为两大类。

(1)类别变量

采用一定的方法对社会现象进行分类,并给每个类别赋予一定的数值,这样形成的变量就是类别变量。根据取值是否可以比较大小,类别变量分为定类变量和定序变量。

1)定类变量

定类变量是测量层次最低的变量。 这种变量仅仅是对被测事物进行了分类,并用数字作为标记不同类别的符号。 因此,这类变量也称名义变量。 变量的取值虽然被赋予了数字标志,但这些数字只有符号意义,没有数据意义,各个取值之间不能进行大小的比较,也不能进行数学运算。 如性别变量通常用1 表示男,2 表示女。 此时的1 和2 只能作为性别的标志,没有数据大小的意义,对1 和2 进行加减乘除运算的结果也没有任何意义。 由于社会测量的水平还比较低,很多社会现象只能达到定类测量的程度。 问卷调查的结果也会形成大量的定类变量,如职业、家庭类型、婚姻状况、学习的专业、人际关系类型、地区类别等。

2)定序变量

定序变量是比定类变量高一等级的变量。 这类变量不仅对被测事物进行了分类,而且划分出了高低不同的等级。 这类变量的取值已经具有一定的数据特征,可以进行高低大小的比较。 但由于这类测量没有单位,两个类别之间具体相差多少是不得而知的。 例如,用1,2,3,4,5,6,7 分别表示文盲、小学、初中、高中、大专、本科、研究生,对人们的文化程度进行量化,此时的数据便具有大小的意义,可以知道高中比初中的文化程度高,对应的数据便是4 比3 大。 但由于没有具体的单位来测量,高多少是无法知道的。 在社会调查中,这类变量也大量存在,如职称、职务级别、学生的年级等。 问卷中用5 个等级或3个等级进行的态度测量和满意度测量的变量均属于定序变量。

(2)尺度变量

如果测量工具有了单位,那么测量结果就不仅能够比较大小,而且能够知道大了多少或小了多少。 这样的测量就是尺度测量,可以进行尺度测量的变量就是尺度变量。 根据测量工具是否具有绝对零,尺度变量分为定距变量和定比变量。

1)定距变量

定距变量的测量工具有了单位,就可以利用得到的测量结果比较被测事物的具体差异了,测量的结果是定距变量。 这类变量的取值具有准确的数据意义,任何两个数据之间的差异都可以准确度量。 但定距变量没有绝对零,即使存在零值,这个零也是相对零。如使用摄氏温度计对温度的测量便是定距测量,温度这个变量便是定距变量。 对于定距变量,变量值之间的加减运算是有意义的,如3 ℃加2 ℃等于5 ℃,这个5 ℃有很明确的实际意义。 但是,由于没有绝对零,变量值之间的比率运算是没有意义的,例如,不能认为10 ℃是5 ℃的两倍。 因为0 ℃是人们确定的冰水的温度,并不是没有温度,所以这个零是相对零。 在社会调查中,使用量表对事物进行测量时,形成的大多是定距变量。 如智商的测量,当某人的智商为零时,可以认为他是痴呆,但并不意味着他完全没有智力。由于定距变量没有绝对零,因此,定距变量的取值之间可以进行差异的比较,但不能进行倍数的比较。(www.xing528.com)

2)定比变量

定比测量是最高层次的测量,它不仅有相等的单位可以比较被测事物间的数量差异,而且可以对被测事物间的倍数进行比较,测量的结果是定比变量。 对于定比变量,变量取值之间和的运算、差的运算以及倍数的运算都具有实际意义。 如两个人的收入分别是2 000 元和4 000 元,两者的和说明两个人共收入6 000 元,两者的差说明后者比前者多挣2 000 元,用4 000 元除以2 000 元,所得的结果说明后者的收入是前者的两倍。 在社会学研究中,常用的定比变量有年龄、收入、住房面积等。

(3)不同层次变量的功能及转换

不同层次变量所具有的功能如表1.1 所示。

表1.1 不同层次变量的功能

第一,在社会学研究中,只满足定距而不能同时满足定比要求的变量并不多。 真正可算是定距变量的,大概只有心理学上所用的智商(IQ)了,常人的智商在100 左右,并且可认为智商在100 与110 之间的差别,相当于120 与130 之间的差别,等等。 因此,在社会学中一般是不再区分定距或定比,而是当作一类,称作定距变量。

第二,一个变量,它的层次并不是唯一的。 如果变量是高层次的,它也必然可以作为低层次来使用。 但降低层次的使用,一般会使资料的信息使用不完全。 例如,收入按实际数填写是定距变量。 但如果按低薪、一般水平和高薪来填,则是定序变量。 而如果只问有无收入,则为定类变量。 一般来说,问卷设计中总是按最高层次来询问,这样可使以后的处理变得灵活。 例如,在询问年龄时,一般问“你年龄多大?”而不会问“你是青年?中年? 还是老年?”

另一方面应该看到变量取值之间的差异与社会实际衡量之间存在着差距或不一致性。 例如,从定距变量来看,收入1 000 元与2 000 元之间的差距等于收入8 000 元与9 000元之间的差距。 但在实际生活中,收入在1 000 元与2 000 元之间,生活水平的差距远比收入在8 000 元与9 000 元之间大。

变量根据研究内容之不同,其层次也可能不同。 例如,性别在医学上如果根据荷尔蒙比例来区分,这时它是定距变量,而不是定类变量。

第三,变量类型的划分不是唯一的。 各领域往往根据自己研究的需要来划分。 例如,工业上把收集的数据分作计量型和计数型。 数学上,习惯把变量分为离散型和连续型。 所谓离散型变量,是变量只可能取有限个值或者一串值,例如家庭子女数只能取正整数。 连续型变量是它可能取某一区间内所有的值,例如身高、体重、年龄等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈