女性和男性之间是否在认知能力上存在总体差异?在我们所处的文化中,许多人对这一问题各持己见互不相让[比如,“每个人都知道男人更聪明”或者“正是因为女人够聪明才让男人以为他们(男性)才更有天赋”]。但是一个认知心理学家仅有观点是不够的,哪怕这种观点被很多人认同。要想回答这一问题,首先必须界定何为更好的总体认知能力。然后还要将这种定义转化为在特定任务上的特定行为或反应模式(这称为将问题操作化,即使之具有可操作性)。最后,心理学家必须招募适合的男女样本,并实施已设定的任务。
心理学家可能选择的一种任务是智力测验。然而,采用这种方法会出现一个问题,在智力测验创编的过程中就已决定。就像Halpern(1992)指出的那样,智力测验的编制者致力于保证男女在得分上没有总体差异。也就是说,很多测验的编制者不容许智力测验中存在男女反应会表现出可信性别差异的项目存在。
然而,这并不意味着男女在认知表现上不存在任何差异。在一篇属于早期经典但后来被广泛引用的关于性别差异的回顾文献中,Maccoby和Jacklin(1974)确认了三种显然具有可信性别差异的认知能力:言语能力、视觉空间能力和数量能力。在本节中,我们将依次对其进行讨论。
在回顾现有文献之前,我们有必要先就心理学家所采用的研究方法与技术进行考察。此类研究主要采用如下三种技术:第一种称为叙事性综述(narrative review),检索并阅读尽可能多的原始资料,然后详细记叙某人的结论。虽然这种总结具有相当的价值,Hyde和Linn(1988)指出叙事性综述有以下缺点:“它不是量化和系统化的,主观性相当强。要完成对100篇甚至更多文献的阅读显然超过了人类思维的信息加工能力。”
Maccoby和Jacklin(1974)运用的第二种技术称为计票(vote counting),顾名思义,这种技术列出各项研究,再清点显示某一特殊效应的研究总数。大体上,每项研究在最后都会获得一定的“票数”,证实存在性别差异的研究为性别之间差异确实存在的观点赢得“一票”;未发现性别差异的研究为相反的观点得“一票”。虽然相对于叙事性综述是一个进步,但计票法依旧存在一些问题。最主要的是,尽管很多研究在总体质量、样本规模、采用的手段和工具的精密度及统计功效上存在差异,但每个研究还是都被赋予同样的权重(Block,1976;Hedges & Olkin,1985;Hyde & Linn,1988)。
用以整合来自不同研究结果的一个更有力的技术称为元分析(meta-analysis)。它是一种用以合并各种不同研究结果的统计方法(Hedges & Olkin,1985)。元分析很受心理学家的欢迎,它可以使研究者对不同的研究做量化的比较。在元分析法中普遍运用的测量指标是d分数,定义为两组的平均得分差除以两组的平均标准差。这一指标称为效果量(effect size)。
我们来看看有关效果量的一个具体例子:假定女性在某一特定言语任务上表现超过男性。如果女性的平均得分是100,男性平均得分为50,如果两组的平均标准差为75的话,该研究的效果量即为(100-50)/75,即0.67。事实上,效果量表示的是两项(或更多)平均数之间存在多少经标准化了的差异。Cohen(1969)提供了一些说明这种效果量值的经验法则:效果量为0.20时被认为是小的,0.50的情况居中,0.80则算是大的。因此,此处0.67的假定值可以看作一个中等偏大的效果量。
言语能力究竟指哪种能力?不同学者给出的定义不尽相同,但是一般认为言语能力包括词汇量、言语流畅性、语法、拼写、阅读理解、口头理解以及解决如言语类比或字谜游戏等语言问题的能力(Halpern,1992;Williams,1983)。Maccoby和Jacklin(1974)在回顾了到1974年为止的大量研究后得出结论,虽然女孩和男孩表现出几近相同的言语能力模式,但在11岁后直到高中及其后的年龄段中,女性在一系列言语任务上的表现均优于男性。这些任务包括语言理解和生成、创造性写作、言语类比及言语流畅性。
但后来的综述(Hyde & Linn,1988)却对Maccoby和Jacklin的结论提出了挑战。运用元分析的方法,研究者调查了165个具以下特点的研究(包括发表的和未发表的):被试都来自美国和加拿大,都大于3岁,且都无语言缺陷(如诵读困难);这些研究都报告了原始数据,且原文提供了充足的信息以计算效果量。被试的言语能力通过词汇、类比、阅读理解、口头表达、作文及一般能力(与其他测量的结合)、SAT语言得分以及字谜游戏等来加以检测。
在被检视的研究中,大约有1/4的研究结果表明男性的表现更好,3/4的研究则发现女性有更出色的表现。然而,当对数据进行统计显著性评估时发现,只有27%的研究在统计学意义上显示出女性的表现显著优于男性,66%的研究发现不存在显著的性别差异,7%的研究发现男性的表现显著地高于女性。如果再考虑所采用的言语任务类型,那只有字谜游戏、语言生成及一般能力等任务上令人信服地显示出女性的优势。这些任务的平均d值分别为0.22、0.20和0.33,表明即使存在显著的性别差异,程度也是相当小的。分析年龄维度上的性别差异,作者也发现无论是学前儿童、学龄儿童、青少年还是成人,在d值上也只能找到非常微小的差异。
心理旋转任务能够令人信服地展现出性别差异。平均来看,男性的表现要优于女性。然而,即使是在这项任务上,许多女性的个别表现也会超出许多个别的男性。
有意思的是,1973年前发表的研究结果中出现的显著性别差异(平均d=0.23)大于近期的研究结果(1973年后的平均d=0.10)。早期的研究表明女性比男性具有更优秀的言语能力;然而越来越多近来的分析反驳了这一论点。对此,Hyde和Linn(1988)总结道:
我们准备下结论说在言语能力上没有性别差异,至少在当今的美国文化中,以标准化言语能力测量工具进行的研究结果如此。对上述结论我们有一定的信心,因为我们对总共包含1418899个被试的165项研究进行了元分析……将119个d值加以平均,得到了10.11的均值。1/10标准差的性别差异实在不值得我们在理论、研究或教材上给予过多关注。我们当然应致力于研究探讨那些具有更大效果量的现象。(p.62)
很多之前的研究者都认为,要想给视觉空间能力这一术语下个确切的定义非常困难(Halpern,1992;McGee,1979;Williams,1983)。通常,它指的是在类似于第8章中所涉及的一些任务上的表现,如对不同物体、形状或图画等进行心理旋转或心理转换。Maccoby和Jacklin(1974)报告,在视觉空间能力上的性别差异确实存在,他们还断言一旦过了童年期,男孩的表现就会更为“优异”,他们报告的d值高达0.40。
可以展示可信性别差异的任务是心理旋转。尽管在该任务的表现上,许多女性的表现比男性个体出色,但是平均来说,男性的表现要优于女性。在过去25年中,研究者在心理旋转任务上一直报告存在相当大的性别效应(d=0.90)(Loring-Meier & Halpern,1999)。
Loring-Meier和Halpern(1999)为调查心理旋转任务中究竟是哪部分显示出性别差异而进行了一项研究。是一个图像的最初形成,是图像在工作记忆中的保持,是审视一个心理图像的能力,还是转变一个心理图像的能力?他们用24名男性和24名女性作为被试来完成四项Dror和Kosslyn(1994)设计的任务,这里我们只讨论其中两项。
首先是图像形成任务:先在屏幕较低处呈现小写字母l作为提示,要求被试想象一个特定的大写字母L,接着,出现一个由四个括号构成的框架区间,有一个X的记号出现在括号内的某一位置,被试须判断如果大写字母显现于框架之内的话X是否会被该大写字母所遮蔽。图13-7提供了例子。
第二个任务是图像保持。首先给被试呈现如图13-8所示的图形。要求被试记住这些图形后按一个键使图形消失。经过2500毫秒的间隔,屏幕上呈现一个X,被试须判断这个图形是否会覆盖住X。
结果表明,四个任务中在准确性方面男性和女性之间没有差异。不过,男性在四个任务中都比女性完成得更快,使研究人员得出结论:“一般情况下,男性在视觉空间表征的运用上更为精通熟练。”(Loring-Meier & Halpern,1999,p.470)。
图13-7 在图像形成任务中,(A)代表学习阶段中一个刺激的呈现,(B)是任务尝试的顺序
资料来源:Loring-Meier, S., & Halpern, D. F. Sex differences in visuospatial working memory:Components of cognitive processing. Psychonomic Bulletin and Review,6, p. 466. Copyright©1999, Psychonomic Society, Inc. Reprinted with permission.
图13-8 用于图像保持任务的刺激
资料来源:Loring-Meier,S., & Halpern, D. F. Sex differences in visuospatial working memory:Components of cognitive processing. Psychonomic Bulletin and Review,6,p. 468. Copyright©1999, Psychonomic Society,Inc. Reprinted with permission.(www.xing528.com)
Linn和Petersen(1985)对空间能力上的性别差异进行元分析后,得出如下结论:在心理旋转任务上,随着任务特性的不同,性别差异的程度大小也不一样。总的说来,符号信息要求加工的速度越快,性别差异就越明显。一些包含复杂三维内容的心理旋转任务通常会比那些简单二维的心理旋转任务显示出更大的性别差异。Linn和Petersen对这种性别差异给出了一些可能的解释。比如,女性在旋转图形时更慢,或者可能是使用于不同的策略来处理任务。
另一原因可能与男女大脑神经生理学上的发现有关。在一篇综述文章中,Levy和Heller(1992)指出,通常情况下女性大脑半球的偏侧优势和功能专门化程度低于男性。男女大脑半球在认知活动中的作用有些微的不同,这种说法在心理学上由来已久。对我们中的绝大多数(特别是习惯用右手的)人来说,言语流畅性、言语推理和其他分析性推理基本都由左半脑管理,与之相对,右半脑则专司理解空间关系和干预情感信息。
男性大脑比女性更多地具有偏侧优势,即意味着男性在其两个脑半球功能上表现出更多的不对称性。例如,女性在两个半球中多多少少都有语言功能的区域。与此相联系,左半脑损伤的女性比有同样损伤的男性在语言功能恢复方面情况要好(Levy & Heller,1992)。
在功能上有更多的不对称性意味着什么?它可能意味着更多的功能专门化,而专门化程度越高则表示个体执行特定任务时所拥有的资源越多。总体上,男性具有更多的偏侧优势使他们在处理如心理旋转这样的特殊空间任务时拥有更多的资源。当然,这个结论必须给予谨慎说明。虽然偏侧优势的性别差异被很好地证明,但并不是说每一位男性都显示出比任何一位女性更多的偏侧优势。而且,那些能够证实空间能力存在性别差异的任务都局限于一个很窄的类型中。
另一项研究(Levine,Vasilyeva,Lourenco,Newcombe & Huttenlocher,2005)给空间能力存在性别差异的观点增加了一个新的难题。这些学者给刚刚进入二年级的男孩和女孩呈现两个空间任务和一个非空间任务,进行为期一年的研究。不出所料,研究者在非空间任务(句法理解)上没有发现性别差异;在两个空间任务上(心理旋转和使航空照片与地图对应)发现存在总体的性别差异。然而令人惊讶的是,这种总体的差异是随着儿童社会经济地位的变化而变化的,如图13-9所示。尤其是低社会经济地位的学生在所有任务中并没有表现出任何性别差异;只有中等和高社会经济地位的学生表现出在空间任务上传统的男性优势。对于与社会经济地位相关的不同情况的一个可能解释如下:
对于与社会经济地位有关的差异一个可供选择的解释是,高水平地参与各种各样促进空间能力发展的活动,造成了男性在空间方面的优势。在低社会经济地位组,无论男孩还是女孩都难有机会参与这样的活动。尽管对于到底哪种类型的刺激能够促进空间能力发展仍然知之甚少,但是之前的研究指出像乐高玩具、拼图和电脑游戏与空间能力发展有关。进一步来说,男孩比女孩在这些活动上花费了更多的时间……即使低社会经济地位的儿童在玩游戏上也分性别,但是他们比其他孩子接触这类促进空间技能的玩具和游戏的机会少,因为这类玩具和游戏相对昂贵。(Levine et al.,2005,p.844)
图13-9 在航空地图任务(顶层组)、心理旋转任务(中间组)和句法理解任务(底层组)中的得分分布箱线图示意,分数变化随着性别和社会经济地位的不同而变化
总而言之,在空间能力方面存在性别差异的原因无外乎生物学因素,如偏侧优势,以及社会化因素,如能够玩到拼图和电脑游戏,或者两者的结合。不管是哪一种结论,这些差异都是有其应用价值的,例如,对于那些诸如GRE、SAT这类重要标准化考试的编制者来说:
这些测试中的很多问题要求视觉空间完形的形成、保持和转换……在这些重要的测验中,男性平均得分高于女性……这些是要求快速作答的测验,意味着相比那些反应慢的人来说,这些测验对那些回答问题快的答题者更有利(Loring-Meier & Halpern,1999,p.470)。
数学能力这个术语涵盖一类技能,包括算术知识、技能及对数量概念的理解(如分数或比例、倒数)。跟言语能力和视觉空间能力这些术语一样,数学能力对于不同的研究者而言,所指的内容可能略有不同。
Maccoby和Jacklin(1974)认为在小学阶段,男孩和女孩的数学能力相差不多;从12~13岁开始,男孩的成绩和技能开始逐渐超越女孩。Hyde(1981)对Maccoby和Jacklin引用的研究进行了元分析,得出d的中位数分值为0.43。这表明,平均来说,男孩超过了女孩近半个标准差。
Benbow和Stanley(1980,1983)的研究为数学能力存在性别差异提供了更多的支持性证据。他们采用的是数学青年天才研究(study of mathematically precocious youth,SMPY)中的相关数据。SMPY旨在甄别有数学天赋的初中生,之所以将其对象锁定在初中生,是因为在初中阶段学校数学班中的男女学生人数基本一样多。但到了高中阶段,数学班上的男生数量要多于女生。以初中生为对象可以减少这种差异。
SMPY研究对七年级和八年级的学生进行了学术能力评估测试(SAT),该测验为初、高中生所熟悉。表13-2显示了一些结果。Benbow 和Stanley(1980)发现,虽然在SAT言语部分测验中两组表现相当,但在数学部分测验男生的得分比女生大约高30个点,而且分数越高,男生在得同样分数的学生中的比率越高。比如,SAT总分在700分及以上的人中(10000个学生中只有1个达到此分),男生对女生的比例是13∶1(Benbow & Stanley,1983),但有一些证据表明这种性别差异只是发生在那些需运用代数知识而不是几何和算术的特殊测题上(Deaux,1985)。
表13-2 数学天才学生SAT的平均得分
注:N=9 927
①初高中生的随机样本所得的男女平均分数为368(8)
②初高中生平均分:男,416;女,390
③这些杰出的八年级生至少比学校等级排置提早了一年完成课程。
资料来源:Benbow,C. P.,& Stanley,J. C. Sex differences in mathematical ability:Fact or artifact?Science,210,1263. Copyright©1980,American ssociation for the Advancement of Science.Reprinted with permission.
20年后对这批SMPY学生的追踪调查显示,此项研究中的性别差异与这些学生所获学位的性质相关。例如,在某一地区,男性获得数学或与数学相关学科(例如,工程学、计算机科学、物理学)博士学位的人数比女性多5~7倍。调查显示,男性对事业成就的渴望远远高于女性,而女性相比男性而言更加认可均衡的生活(Benbow,Lubkinski,2000;Lubkinski,Webb,Morelock & Benbow,2001)。
Anita Meehan(1984)研究了在其他相关任务,尤其是皮亚杰形式运算任务上的性别差异。在第12章中我们讨论的形式运算任务包括逻辑推理、系统性思维的能力以及考虑所有可能性的能力。Meehan考察了三种形式运算任务:命题逻辑任务,组合推理任务和比例推理任务。对总共53个研究进行元分析后,Meehan在前两个任务上得到很小的d值,分别为0.22和0.10,这在统计学上并不显著。在第三个更为明显的数学任务上(与比率有关),平均d值就增为0.48。
到目前为止,我们已经在诸如视觉空间任务和数学任务等一些认知任务上发现了性别差异的存在,然而,Hyde(1981)指出此类研究中至关重要的一点:如果零假设是真,统计学上可靠的效果量(即发生概率相对较低)值并不必然很大。测量效果量值的一种方法是计算一个为心理学家所熟知的量,即“方差所占百分比”。通俗地讲,这种测量反映的是得分差异中有多少可以由某个假定的变量来加以解释。Hyde计算了各种测量中的效果量值,发现即便是高可靠度的性别差异,由性别引起的方差所占比例也只在1%~5%之间。这就是说,从一个人的性别推测他在特定认知任务(如视觉空间任务或数学任务)上的表现,正确率最多只能达到5%。因此从现存数据中得出“女人应该避免工程学的东西”或“男人更可能是天生的数学家”等结论是完全无保证的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。