《卫报》(The Guardian)是数据新闻领域的执牛耳者。2009年1月15日,《卫报》数据博客(Datablog)栏目发布了它的第一篇数据新闻,标志着《卫报》数据新闻团队的诞生。[1]报道引用英国环境、食品和农村事务部的数据,将英格兰地区的家庭垃圾量和回收率展现在表格中,并在表格上方附上了“数据下载”链接,任何读者都可以通过链接获取报道中全部的原始数据。
数据博客的创始人——数据新闻领域的开山人物西蒙·罗杰斯(Simon Rogers)在开篇词中写道:“我们淹没在信息中。网络让我们能够接触到此前从未发现的数据,从行业数据集到宏观经济细节。但是,寻找最简单的事实或统计数据,谷歌将呈现100万个相互矛盾的数据,这就是数据博客产生的原因。……数据博客每天会处理来自世界各地的数据集,我们会检查这些数据,并确保这是从最可信的来源获得的质量最佳的数 据集。”[2]
除了确保数据质量,为贯彻开放新闻室的策略,数据博客还同时推出了姊妹项目“数据商店”(Data Store)。数据商店集纳了数据博客发布的全部数据集,并向所有读者开放。数据商店特意使用谷歌文档而不是电子表格来发布数据集,因为谷歌文档具有实时更新的功能,以确保读者可以获得最新的统计数据。
数据博客日后的报道也延续了开放数据的操作,即大部分报道的原始数据都向读者公开,“开放”是《卫报》数据新闻实践最核心的特征。《卫校》前任主编阿兰·拉斯布里杰(Alan Rusbridger)解释道,与制作新闻同样重要的是“共享我们发现和收集的数据,以及如何处理数据,邀请读者基于数据做进一步分析和改进”[3]。
数据博客邀请读者对其数据进行二次创作,并在社交网站Flickr上开设了群组,[4]邀请读者上传作品,同时声明《卫报》可以使用读者的作品。通过“开放”数据,《卫报》试图将读者“卷入”到新闻生产过程中,有研究者认为,数据新闻实质上是《卫报》为应对新媒体特别是公民新闻的冲击而提出的开放新闻室的具体策略之一。[5]而通过这种策略,“非专业人士”或称“业余生产者”被收编到机构媒体之中。
一份《卫报》数据新闻整理清单显示,[6]2009年1月15日至3月1日,数据博客成立之初的一个半月时间里,罗杰斯撰写了67篇署名报道中的65篇。这个最初只是用来分享新闻背后数据的博客网页,随后拓展为向公众提供全球政府数据查找链接和搜索工具的团队。
在组织架构上,数据博客相当于“虚拟组织”,它并不像其他部门一样拥有固定成员和严格规定的工作量,而是依据项目从各个部门抽调成员组成临时的项目组。《卫报》数据新闻团队在创立之初仅有两位相对固定的成员,其他成员并非全职数据新闻记者,且同时隶属于《卫报》的不同部门,从事其他新闻采编工作。目前数据博客在英国和美国分别设有五人交互设计团队,团队由专业设计师、交互设计开发人员和记者组成,与其他部门合作完成数据新闻项目。自由撰稿人的新闻作品或数据研究者的观点也有可能登上博客主页。这种虚拟组织的形式在团队创立之初有利于减少组织内部障碍,推动新生事物的发展,财新数据与可视化实验室也是采用的这种策略。但当数据新闻成为一项常规生产实践后,这样的组织架构或许已无法满足常规生产的需要。
《卫报》对数据可视化采取了非常谨慎的态度。数据博客成员默多克(John Burn-Murdoch)在一篇名为《为何你绝不能相信数据可视化》[7]的文章中写道:相较于文字,读者更难在可视化中发现数据错误。因此数据经可视化设计后,数百万读者可能盲目地接受了被可视化的信息,并将其视为事实。他提议,在可视化作品中,除了提供数据源和与数据、图表相关的说明,还应该告知读者可视化作品可以在多大程度上被视为或者不被视为科学事实。这些信息都应该在作品传播时更好地告知读者,以免造成错误信息的传播。这也是《卫报》强调让读者参与到数据分析过程中的一个重要因素。这或许也可以部分地解释为何数据博客的可视化常被业内人士诟病,因为在其看来,更重要的是数据分析。下文我们将通过一个具体报道案例来审视开放的新闻生产理念是如何贯穿于数据新闻生产过程中的。
案例分析:议员花销(MPs' expenses)[8](www.xing528.com)
2009年5月,英国部分国会议员被曝光“虚假报销”。《每日电讯报》和《星期日电讯报》获得爆料,得知英国646名国会议员中有200多人涉嫌“虚假报销”,公务经费用于报销个人生活开支。新闻一出,引起了民众强烈不满,公众的要求提前进行大选,更换议会成员。
这则《每日电讯报》的独家报道是基于英国议会即将公布的议员报销明细,该报提前获得了这份文件,记者有相对充足的时间分析、写稿,相关独家报道让该报时间销量剧增。[9]《卫报》则处于竞争劣势,在议会公开所有资料之前,数据博客也已经开始规划如何报道议员开销。[10]
当议会公开全部资料后,数据博客记者发现,数据分析的难度远超其想象。议会并没有提供格式友好的电子文档,而是在其网站上上传了5 500份PDF材料,包含70万个单独文件。这些文档记录了646名国会议员在过去四年里的每一次报销记录。毋庸置疑,这是一个极具价值且信息量巨大的潜在数据库,但因为PDF文档难以直接进行数据分析,关键的内容,比如个人信息和地址等又是隐蔽的,数据博客团队几乎不可能在短时间内看完大量材料,也无法进行有效的分析。于是团队成员想到了使用“众包”(Crowdsourcing)的方法,即邀请读者共同分析这些材料。“(我们)时间非常少,几乎干不了什么事情。那除了向读者开放,还能有什么更好的方法吗?”[11]
罗杰斯当日就发表文章,指导读者如何在《卫报》专门设计的系统中阅读这些文档,并将信息反馈给编辑部。数据博客所搭建的系统可以让读者快速找到所有议员,特别是当地议员的报销单,读者还被邀请对每份文件的“值得研究程度”打分,找出其中有意思的地方,评价这个议员的报销状况并帮助《卫报》录入文档中的相关数据。《卫报》网站主编吉布森(Janine Gibson)认为,众包的方式可以增强新闻机构与读者的互动,让读者实时知晓自己和其他人的新发现。[12]罗杰斯也认为将众包项目做得有意思很重要,他在第二次推出议员报销调查项目时加入了一个小任务,像玩游戏一样,参与众包的读者可以查看自己在全部参与者中的排名(见图5—1)。[13]
图5-1 《卫报》议员报销众包项目页面[14]
《卫报》将读者帮助录入的数据整理成表格并按照花费用途进行了分类,并在数据博客网页上提供了下载表格的链接。“我们并不能保证能找到更多虚报报销的案例,但我们希望通过这次众包让信息尽可能地透明化,让公众能方便地使用数据,而不是仅仅停留在阅读上。”[15]
《卫报》的“国会议员开销”的报道获得了巨大成功,众包不仅成了《卫报》报道策略中不可分割的一部分,也是其开放新闻室策略的具体体现。记者一直试图让读者参与到新闻生产过程中,让他们成为报道的一部分。[16]这种透明化、参与化的努力有利于提升读者对媒体机构的信任程度,亦可推动公民积极参与政治生活。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。