度量水平(level of measure),是对一个变量所含的变量值关系的一种分类,是针对不同种类的数据的尺度水平的划分。
举个例子。如果老张跟我说他今天在街上被一个美女搭讪了,我可能会问,什么年纪啊?他可能会说“挺年轻的”,或者告诉我“二十来岁”,或者更准确地告诉我“28岁,美女身份证上写的……”——这些描述方式都可以表现一个人的年龄,但是你会发现它具体包含的信息量是不一样的。假如我们要收集500个不同年龄段研究参与者的年龄,我们选择不同的对年龄的测量方法,比如选择以下这些中的一种:
(a)请标注最能准确描述您年龄段的一项:A.青年;B.中年;C.老年。
(b)请标注最能准确描述您年龄段的一项:A.10~19岁;B.20~29岁;C.30~39岁;D.40~49岁;E.50~59岁;F.60~69岁;G.70~79岁;H.80~89岁;I.90~99岁;J.100岁以上。
(c)您的年龄是?(请给出具体数字)
我们注意到,第三种提问的方式会给到我们一个具体的数字,这个数字的信息量,要比前两种的信息量大、精准度高。前两种的变量值,比如“青年、中年、老年”是一种排序的关系——越往后年龄越大,但是具体年龄是多少,研究者并不能判断。
以上例子就体现出了两种不同的“度量等级”——a和b测量方法测出的变量叫“有序变量”,而c测量方法测出的变量叫“定比变量”。
具体来说,最常见的度量等级一共有以下四种,所有的变量也都可以按照其变量值之间的关系,划分为四种中的一种:
(1)名义变量(nominal variable):这类变量的变量值都是一些没办法排序也没办法定量的东西,比如以下这些变量:“性别”“宗教”“民族”“专业”“出生地”“国籍”。这类变量的变量值一般都不是数字,或者即便是数字,也只是作为指代符号而存在。比如“学号”这个变量,虽然是数字型的,但是并没有实际的意义,并不会因为有的同学是“2058”号,有的是“8502”号,后者就比前者多了什么品质。这两个数字只不过用来指代不同的两个人。
(2)有序变量(ordinal variable):这类变量的变量值可以按照一定逻辑进行排序,从低往高排,或者从高往低排。比如“学生的年级”(变量值=一年级、二年级、三年级)就是一个有序变量,因为我们可以通过这个变量把学生进行排序,并且这种排序是有意义的。“某人对一个陈述的同意程度”(变量值=非常不同意、不同意、中立、同意、非常同意)也是有序变量。另外,“受教育水平”(变量值=小学、初中、高中及职高、大学本科、硕士、博士、博士以上)也是一个有序变量。你可以注意到,一个有序变量给我们提供的信息量要比名义变量大——如果两个人在回答问卷时一个人选了“初中”、一个选择“硕士”作为他们的教育水平,我们不仅知道这两个人的受教育程度是不同的,而且,我们还知道第二个人的受教育水平高于第一个人,这就是有序变量跟名义变量的不同。
(3)定距型变量(interval variable):这类变量的变量值不仅可以排序,而且每个变量值之间的数值差(interval)也是有意义的。比如“摄氏度”这个变量(变量值=1度、2度、3度……)就是一个定距型变量;“人的智商值(IQ)”也是一个定距变量,假如小明的智商值是50,小白的智商值是150,我们就知道这两个人的智商值差距还蛮大的,他俩应该玩不到一起去,而如果小明的智商是140,小白的智商是150,我们知道这两人智商值差距不大。请注意这种对变量值之间差距的比较是定距型变量可以做到,而名义变量和有序变量都无法做到的。
(4)定比型变量(ratio variable):变量值不仅兼具以上三种变量的全部功能(区分变量值、排序变量值、计算变量值差距),而且它的“零点”是“绝对的零点”(absolute zero),基于它进行的乘除和比例的计算也是有意义的。生活里很多这种变量,比如,“年龄”“工资”“教育费用花销”“学生的人数”“组织里员工的人数”……这些都是定比型变量。定比型变量和定距型变量的变量值一般看上去都是“数字”,但他们最大的区别就是,对这些变量值做乘除法计算有没有意义。比如,如果小明一天赚50元,小白一天赚150元,我可以得出“小白一天的工资是小明的3倍”——这个通过除法得出的倍数是有意义的;但回到定距型变量的例子,小明的智商值是50,小白的智商值是150,我不能说小白的智商值是小明的3倍,因为IQ这个变量并不是定比型变量,这两个人之间的数值差有意义,但数值的商没有意义。另一个评判标准是“绝对的零点”,比如对于“工资”这个变量来说,一个人的数值是“0”是有意义的,因为这个人的工资是“0”,就是他没有赚钱。但对于“智商值”这个变量来说,一个人的IQ值如果是“0”,不代表他就没有智商或头脑,只能代表他智商值低;对于“气温”这个变量来说,“0”度并不代表温度这个东西不存在,而代表那一天的温度到达了冰点这个值。你会发现上述两个定距型变量是不存在“绝对的零点”的,只有定比型变量有绝对的零点。
如果你是初次接触变量、变量值、度量等级,看到这里有点发懵是非常正常的。这里的要点是:①变量根据度量等级的不同可以分成不同的种类,而不同类别的变量将决定你的分析方法用哪一种比较合适;②从名义变量到定比型变量,你的变量值所提供的信息量是越来越大的,但是这并不代表度量等级越高的测量方法就一定是更好的。如果一个变量可以采取多种测量方法,要通过研究的需求和收集数据的现实条件来决定哪一种测量方法更合适。
图2-5 四种不同类型变量的比较
(引自https://conjointly.com/kb/levels-of-measurement/)(www.xing528.com)
总结一下四个度量等级的区别:
·名义变量:它们的变量值只能用“相等”或“不等”来表示。
·有序变量:它们的变量值之间可以用“大于”或“小于”的关系来表示。
·定距型变量:它们的变量值之间可以“加减”。
·定比型变量:它们的变量值之间可以“乘除”。
最后,给大家留一些练习题,看能否分清不同变量的类型。
【练习二】
请指出以下变量是属于“名义变量”“有序变量”“定距型变量”还是“定比型变量”:
·学生的年级:一年级、二年级、三年级……
·学生在数学课上的学习时间(小时)
·是否是理工专业(是/否)
【参考答案】
练习二的答案按顺序为:
有序变量、定比型变量、名义变量、名义变量。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。