公开征集可以让你为那些你能清楚地描述但无法自己解决的问题找到解决方案。
在上述三个公开征集的项目,即网飞奖、蛋白质折叠游戏和公众专利评审中,研究人员都是先提出一个特定形式的问题,然后公开征集解决方案,最后挑选最好的解决方案。研究人员甚至都不需要知道可以请教的最好的专家是谁,其实好的想法有时会来自意想不到的地方。
鉴于我已经对人本计算项目和公开征集项目进行了介绍,所以现在我可以强调两者之间的两个重要区别了。首先,在公开征集项目中,研究人员指定的是一个目标(例如预测电影评分),而在人本计算项目中,研究人员指定的是一个微任务(例如对一个星系进行分类)。其次,在公开征集项目中,研究人员想要的是最好的贡献,例如预测电影评分的最好算法、蛋白质的最低能量构象或者最相关的现有技术文献,而不是所有贡献的简单集合。
我已经描述了公开征集的通用模板以及三个示例,那么社会研究中的哪些问题适合用该方法来解决呢?在这一点上,我得承认成功的例子还不是很多(我稍后会解释原因)。就直接模拟而言,我们可以设想一下,一位历史研究人员通过公众专利评审式的公开征集查找最早提及某个特定的人或想法的文件,尤其是当潜在的相关文件没有被归档在一起,而是广泛分散在各处时,公开征集对这类问题的价值就更大了。(www.xing528.com)
更普遍地讲,许多政府和公司都有需要公开征集解决的问题,因为公开征集能够产生预测算法,而这些预测可以成为行动的重要指南(Provost and Fawcett 2013;Kleinberg et al.2015)。例如,就像网飞想要预测电影评分一样,政府可能想要预测哪家餐馆最有可能违犯卫生法规等,以便更有效地分配检查资源。鉴于此,爱德华·格莱泽(Edward Glaeser)和同事便利用公开征集帮助波士顿市根据点评网站Yelp上的点评数据和历史检查数据预测餐馆的卫生违规情况。他们估计,通过公开征集所选出的最好的预测模型能够将餐馆检查员的工作效率提高约50%。
公开征集还可能被用于比较和测试理论。例如,脆弱家庭和儿童福利研究(Fragile Families and Child Wellbeing Study)对在美国20个不同城市出生的约5000个孩子进行了追踪(Reichman et al.2001)。研究人员分别在孩子出生时以及1岁、3岁、5岁、9岁和15岁时搜集了有关这些孩子、他们的家庭以及他们所处的更广泛的环境方面的数据。那么研究人员利用所有这些数据预测谁将能够大学毕业的准确度将如何呢?或者用有些研究人员更加感兴趣的方式来表达就是,哪些数据和理论在预测这些结果方面最有效?因为这些孩子目前都还没到上大学的年龄,所以这将是一个真正前瞻性的预测,而且研究人员可能采取的策略也有许多。认为社区对大学毕业等结果至关重要的研究人员与认为家庭至关重要的研究人员所采用的方法可能截然不同。那么哪种方法会更有效呢?我们并不知道,在寻找答案的过程中,我们可能会学到一些有关家庭、社区、教育和社会不平等的重要知识。此外,这些预测也许能被用来指导以后的数据采集。假如有一小部分大学毕业生在之前各种方法的预测中都是不可能大学毕业的,那么这些人将是后续定性采访和人种志观察的理想人选。因此,在这一类型的公开征集中,预测并不是目的,相反,它们为比较、拓展和结合不同的理论传统提供了一种新方法。这种公开征集不只适用于利用脆弱家庭和儿童福利研究的数据来预测谁将上大学,它还可以预测最终会被搜集到纵向社会数据集中去的所有结果。
正如我在本小节前面部分所写的,目前还没有很多社会研究人员采用公开征集方法的例子。我认为这是因为公开征集的提问方式与社会科学家通常的提问方式不太一样。社会科学家通常不会问有关预测品位的问题,相反,他们会问不同社会阶层的人的文化品位为什么会不同以及是如何不同的(参阅例如Bourdieu 1987)。像这种“如何”以及“为什么”的问题,其解决方案通常都不易于检验,因此似乎不适用于公开征集。所以,似乎公开征集更适用于预测性问题而不是解释性问题。但最近理论家已经开始呼吁社会科学家重新考虑解释和预测之间的分界线(Watts 2014)。随着解释和预测之间的界线越来越模糊,我希望公开征集在社会研究中能变得越来越普遍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。