维基百科是不可思议的。志愿者的大规模协作创造了这样一部每个人都能使用的百科全书。维基百科成功的关键不是新知识,而是新的协作形式。幸运的是,数字时代使许多新形式的协作成为可能。因此,我们现在应该想想:有哪些重大的科学问题,我们单独无法解决的问题,是现在通过协作能够解决的?
当然,科研协作已经不是什么新鲜事了,新鲜的是数字时代使我们能够与数量更多、更多样化的人进行协作:全世界能够上网的数十亿人。我预计这些新的大规模协作将产生惊人的结果,不仅是因为它们所涉及的人数,还因为这些人所具有的多种多样的技能和视角。我们如何才能让每个互联网用户都参与我们的研究过程呢?如果你有100名研究助理,你能做什么?如果有10万名熟练的协作者呢?
现在有许多种形式的大规模协作,计算机科学家通常会根据技术特点把它们分成大量的类别(Quinn and Bederson 2011)。然而在本章中,我将根据它们能如何被用于社会研究来分类。具体来说,我认为将它们大致分为三种类型的项目是有帮助的:人本计算、公开募集和分布式数据采集(图5.1)。
图5.1 大规模协作示意图。本章将围绕三种主要形式的大规模协作展开论述:人本计算、公开募集和分布式数据采集。更一般地讲,大规模协作将源于公众科学、众包和集体智慧等领域的想法结合了起来。(www.xing528.com)
我将在本章后面部分更详细地描述每一类型的项目,但现在先让我简单描述一下每个类型。人本计算项目非常适合任务简单、数量庞大的问题,例如给100万张图片贴上标签。这类项目在过去可能是由作为研究助理的大学生来完成的。为这类项目做出贡献不需要具备与任务相关的技能,并且最终的输出通常是所有贡献的平均值。人本计算项目的一个经典示例是星系动物园(Galaxy Zoo),在这个项目中,10万名志愿者协助天文学家对100万个星系进行了分类。公开募集项目则非常适合为明确公式化的问题寻找新奇的、令人意想不到的答案。这类问题在过去可能需要请教同行。为这类项目做出贡献需要具备与任务相关的专业技能,且最终的输出通常是所有贡献中最好的那一个方案。公开募集项目的一个经典示例是网飞奖,在这个项目中,成千上万的科学家和黑客致力于开发新的算法来预测用户对电影的评价。最后,分布式数据采集项目非常适合大规模的数据采集。这类项目在过去可能是由作为研究助理的大学生或调查研究公司来完成的。为这类项目做出贡献通常能够接触到研究人员无法接触到的数据采集点,且最终的产品就是所有贡献的简单合并。分布式数据采集项目的一个经典示例是观鸟数据库(eBird),在这个项目中,成千上万的志愿者会贡献有关他们所看到的鸟类的报告。
大规模协作在天文学(Marshall,Lintott,and Fletcher 2015)和生态学(Dickinson,Zuckerberg,and Bonter 2010)等领域有着丰富而悠久的历史,但在社会研究中还不常见。但是,通过描述其他领域的成功项目并提供一些关键的组织原则,我希望能让大家相信两件事。首先,大规模协作可以被用于社会研究。其次,使用大规模协作的研究人员将能够解决以前似乎不可能解决的问题。虽然倡导大规模协作的人经常会说采用大规模协作能够省钱,但其实它的优点远不止于此。正如我将要展示的,大规模协作不仅能让我们以更便宜的方式开展研究,还能让我们把研究做得更好。
在本章之前的章节中,大家已经明白了用下述三种不同的方式与人互动能了解到什么:观察他们的行为(第2章)、向他们提问(第3章)和招募他们来参与实验(第4章)。在本章中,我将向大家展示,做我们的研究协作者能了解到什么。对于上述三种主要形式的大规模协作,每一种我都将描述一个典型示例,然后再进一步用其他示例来阐明与之相关的重要知识,最后描述这种大规模协作被用于社会研究的可能方式。本章最后将介绍5个有助于你设计自己的大规模协作项目的原则。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。