首页 理论教育 持续性研究:土耳其盖齐公园示威活动的推文数据分析

持续性研究:土耳其盖齐公园示威活动的推文数据分析

时间:2023-07-21 理论教育 版权反馈
【摘要】:图2.1布达克和瓦茨用来研究2013年夏天发生在土耳其的盖齐公园示威活动的设计。利用推特的持续运行属性,研究人员搜集了约30000人在两年内的推文,并将这一数据称为事后纵向数据。因为很多大数据系统是不断变化的,我把这一过程称为漂移,并将在后面的2.3.7小节中具体介绍。表2.1利用持续运行的大数据系统进行的突发事件研究

持续性研究:土耳其盖齐公园示威活动的推文数据分析

大数据系统的持续运行使得研究突发事件和进行实时监测成为可能。

许多大数据系统都是持续运行的,它们在不断地搜集着数据。这一特征使研究人员能够获得纵向数据(即在一段时间内的数据),它对研究有以下两个重要的影响。

首先,不间断的数据采集使研究人员能以之前不可能的方式来研究突发事件。例如,对2013年夏天发生在土耳其的盖齐公园示威活动感兴趣的研究人员通常会关注示威者在活动期间的行为。而杰伦·布达克(Ceren Budak)和邓肯·瓦茨(Duncan Watts)凭借推特的持续运行属性,对在示威之前、期间以及之后使用推特的示威者进行研究,并且创建了由未参加示威的人组成的对照组,对照组也分为示威之前、期间以及之后(图2.1)。最终,他们的事后纵向数据(ex-post panel)共搜集了30000人在两年内的所有推文。通过在研究人员常用示威者数据的基础上增加这一额外的信息,布达克和瓦茨可以研究更多的内容:评估什么类型的人更有可能参与盖齐公园示威活动以及参与者和非参与者在短期(对比示威之前和示威期间的数据)和长期(对比示威之前和示威之后的数据)内的态度变化。

怀疑论者可能会指出,即便没有不间断的数据采集资源,上述某些评估(例如长期内的态度变化)也是可以进行的。这一观点是正确的,尽管搜集30000人的数据成本相当高昂,但只要有足够的预算,这一问题便能解决。然而我想不出有什么办法能让研究人员穿梭到过去,直接观察参与者在过去的行为。最接近的办法可能是搜集有关参与者行为的回顾性报告,但这些报告的粒度是有限的,准确度也不高。表2.1列出了一些利用持续运行的大数据系统进行的突发事件研究。

图2.1 布达克和瓦茨用来研究2013年夏天发生在土耳其的盖齐公园示威活动的设计。利用推特的持续运行属性,研究人员搜集了约30000人在两年内的推文,并将这一数据称为事后纵向数据。与关注示威期间参与者的典型研究相比,事后纵向数据增加了:(1)示威前、后参与者的数据;(2)示威前、中、后非参与者的数据。这一更丰富的数据使布达克和瓦茨能对“什么类型的人更有可能参加盖齐公园示威活动”以及参与者和非参与者在短期(对比示威之前和示威期间的数据)和长期(对比示威之前和示威之后的数据)内的态度变化进行评估。(www.xing528.com)

除了研究突发事件以外,持续运行的大数据系统还能让研究人员进行实时评估。对政府或各行业的决策者来说,当他们想要依据态势感知确定应对措施时,这一点就会变得很重要。例如,利用社交媒体数据指导对自然灾害的应急响应(Castillo 2016),利用各种不同的大数据资源对经济活动进行实时评估(Choi and Varian 2012)。

综上所述,持续运行的大数据系统能让研究人员对突发事件进行研究,也能为决策者提供实时信息。但如果要追踪很长一段时间内的变化,我认为这些系统就不适用了。因为很多大数据系统是不断变化的,我把这一过程称为漂移,并将在后面的2.3.7小节中具体介绍。

表2.1 利用持续运行的大数据系统进行的突发事件研究

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈