HOW NUMBERS RULE THE WORLD
THE USE AND ABUSE OF STATISTICS IN GLOBAL POLITICS
“如果数据是体现宇宙神秘性的一个方面,我们则容易被使用数据的人控制。如果数据是人类掌控混乱的方法,它就会成为科技精英手段的一部分。”
——D.鲍伊尔,《数据的暴政》,2001
我们要如何与数据争论?正如这本书所说的,数据的天性即揭露事实的本质,不必介意它是否真的这样做。我们都知道数据只是社会现象的部分表现,并且它通常被科学地或是政治地操纵,但是,它们的表现形式与设计都是围绕实证概念建立的——客观实证。当我们看见一个数据,我们便产生了确定性——事实信息。数据并不像文字,不需要解读,数据至今都是权威的来源,因为它揭露事实,而事实无可争议。(www.xing528.com)
当然,这并不是说,数据研究永远无法被质疑。在学术界,我们时常对数据进行争论,也讨论方法论并努力保证全面公开。我们的学生非常了解这一点,当他们展示自己的调查时,他们总是害怕这个不可避免的问题:“你从哪里得到的数据?”在我们发表文章时,我们通常会将免责声明包含在内,尤其当数据模型构成了我们分析的主干时。我们,作为学者,乐于警告读者我们的数据也许不够完整,以及我们的模型所基于的关键假设也许将真实情况过分简化了。通常我们会通过脚注、尾注、星号以及附录来处理这个问题,或许是因为我们知道那些内容只有极少数人才会读。这有点像广告宣传,在某个公司将新产品所有令人赞叹的特征大肆渲染后,他们会在难以看到的广告底端用小写字体补充上“适用条款及情况”。
总体上,目前用一些数据来证实学术分析是发表文章的前提。在社会科学领域最著名的学术期刊如今也不愿刊登任何连一个方程式、几个回归分析或一个因素分析都没有的文章,这是“定性”调查者的寒冬。不幸的是,对数据的追求不可避免地削弱了我们调查的分析深度,因为我们趋之若鹜地在数据集之间寻找关联与数据的意义,极少思考我们的数据的真实质量,并且检查数据质量并不代表我们能够保证平均值是正确的或缺漏的数据不会影响最终结果,它意味着质疑数据作为所研究社会现象的良好描述符号的终极可信度。这些数据真的能够告诉我们关于社会的有价值的事吗?数据只是简单地描述社会现实还是已经变成了我们改造社会的规范工具?以及重要的是,我们有教我们的学生用批判眼光看待数据吗?不幸的是,人们对于自己知识的自满已经蔓延到了整个学术界,损害着我们的创新思维以及我们挣脱既定概念的能力。而且,免责声明不管听起来多么真诚,都不足以“将我们从邪恶中拯救出来”。
毫无疑问,数据已经不仅主导了学术思考,也主导了我们自己对于学术界作用的理解。首先,我们不断受到标准化的绩效评估。这一趋势最早起源于20世纪70年代的北美与英国,随后蔓延至欧洲和亚洲、南美洲、非洲的大多数新兴国家。学者们围绕着一个关键数据——H指数而生存,该数据是一种复杂的、用于计算我们的文章在其他学术文献中出现频率的方法。谷歌学术——数据革命时代的强大学术资源库——也已经成为施加在我们许多人身上的诅咒,因为大多数指数都是由谷歌自动计算得出的,而当谷歌没有注意到我们当中的某一篇文章时,我们就有麻烦了,“发表或湮灭”已经成为对我们的诅咒,“引用或被引用”则是我们新的铁律。我们学术生涯中另一项基本的指数是所谓的“影响因子”,它是由信息机构路透社计算得出的,显示了一本指定期刊中文献引用的平均数。如果你想在数据的学术丛林中生存下来,你必须努力在高影响力期刊上发表文章,剩下的期刊则无关紧要了。但是这些数据真的能够代表一个人研究成果的质量吗?或许能。但同时,它也会产生反常动力,因为数量变得至关重要,学者们都感到了达到标准要求的压力。数量下降时,全体研究人员都变得焦虑起来,他们开始召集特殊会议,职业生涯岌岌可危,名誉与耻辱已经成为司空见惯的事。学术人员之间互相引用已经司空见惯,自引比比皆是。审查者们通常只批准那些引用了一篇或多篇他们自己文献的研究发表,引用量已经成为晋升、涨薪或在常春藤大学谋职的关键,这些数据不仅对我们的名誉,也对我们的银行账户有着根本的“影响”。并且,在这场数据引发的狂热中,许多学者被曝光抄袭、重复发表以及伪造数据也是意料之中的事了,他们都极力试图跟上这种大流。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。