2005年,麻省理工学院的一帮闲得无聊的研究人员发明了一个叫SCIgen的计算机程序,这一程序可以在网上自由传播,任何人能用它快速生成一篇格式规范、图文并茂的“论文”,但是内容是词汇和句子的无意义组合。很快,这一事件过去了。
克里尔·拉贝
法国约瑟夫傅立叶大学的计算机科学家有一个叫克里尔·拉贝(Cyril Labb)的好事者,喜欢在网上检测一些已经发表的科研论文,并且他也喜欢用这种方式开玩笑。2010年,拉贝创造了一个叫作Ike Antkare的作者,制造了101篇虚假的论文,这些文章通过了测试,并且被“谷歌学术”(Google Scholar)收录。他的花招成功了,并且让Ike Antkare还成为了世界上第21位被引用次数最高的“科学家”。他在一篇文章中介绍了这个想法。他在那篇文章的导论部分中指出,Ike Antkare可以实现排名到21位的目标,并且告诉读者如何做也可以像Ike一样棒。下面的图1解释了上述101篇文章是如何产生出来的。
图1 虚假文件与真实文件之间的关联
但是接下来的事情就严重了。2013年前后,拉贝在两大出版社——德国司伯林格出版社和电气与电子工程师学会(IEEE)的数据库中发现了一些使用SCIgen随机生成的假论文。司伯林格出版社引用了16篇,而IEEE则有100多篇。他发现除了4篇,其他100多篇都是来自中国大陆,而且大部分是会议论文。最后这些论文均被撤销。
【点评】
美国物理学家索卡尔曾经自己撰写了一篇讨论物理学中的后现代主义方面的文章,然后发表出来,引起了人文学界的轰动。但是后来索卡尔主动承认他所发表的文章完全是拼凑的,没有实质内容,其主要目的是考验一下社会科学界是否理解自然科学。这一行为引起了学术界很大争议。有人谴责索卡尔的行为不道德;也有人注意并且反思自然科学与社会科学之间的鸿沟。拉贝的行为有些类似于索卡尔,他们的行为有些像孩子,有点顽皮。他们本意并非要博得名气,也并非像某些科学家,如韩东杓骗取经费,而是要考验一下科学界。
拉贝用计算机程序虚拟了一位科学家Ike Antkare,然后借助类似SCIgen的计算机程序生成论文,最后这位虚拟的科学家进入到谷歌学术中排名前30的行列。拉贝的问题是制造了这个虚拟作者。他的目的是检验自然科学家,随后他告知了相关机构关于事情的真相。他的本意是希望相关机构能够注意到这个问题并能加以防范。可以说,出发点是好的。但是,我们也必须从拉贝事件中注意到好的动机一旦不被理解可能会产生的恶的结果。《虎胆龙威4》(2007年)中讲述了这样一个故事:美国政府前计算机专家托马斯·加布里埃尔(蒂莫西·奥利芬特饰)在刚上班时指出政府计算机系统存在的漏洞风险,但是被上级主管部门无视,他被受到忽视后用自己的行动——入侵并关闭政府网站——证明他是对的,但是最终却被解雇。因此他怀恨在心,召集一些黑客展开了一个捣毁美国的恶毒计划,然而被卷入其中的黑客小伙法莱尔和老警官麦克莱恩一起阻止了这项计划。整个影片就反映了这个问题,虽然加布里埃尔最初的动机是好的,作为一名工作人员,能提醒上级注意到系统的漏洞,但是因为被无视,心理受到伤害,为证明自己正确而实施了恶毒计划,最后被解雇。在这个过程中,他的心理发生了很大变化。因此,对于拉贝,要防止类似的事情发生。当然,上述出版机构也采取了一些措施,如撤回文章。撤销违法学术规范的文章是他们一贯的做法。(www.xing528.com)
再看Ike Antkare,这是拉贝带给学术界的新的事物。甚至可以被看作是某种意义上的人工智能,它随机生成了100多篇论文并且瞒过了专业编辑的眼睛。目前,人工智能的发展已经引起了人们的反思。人们将反思的目光聚焦在图灵测试上:计算机能否通过人的测试?目前人工智能的发展表明:极有可能。所以拉贝行为的价值让我们进一步思考人工智能在论文写作领域中的问题。所以人工智能给我们带来的将是更大的挑战。
拉贝事件与一般意义上的学术造假、抄袭、剽窃不同,它带给我们是道德哲学中的基本问题:动机论的问题。善的行为是通过动机来衡量还是通过结果来衡量?如何让善良动机被呵护,从而产生善的结果。在这一过程中要防止善良动机、新的想法被忽视、被无视。我们每一个人要学会欣赏他人,而不是无视、嘲笑他人的想法。
[1]林睿.谷歌学术搜索的缺陷——基于检索式、专利及引用功能的抽样分析[J].现代情报,2014(2):103—106.
[2]赵春雷.学术不端者的下场[J].世界科学,2009(9):36—39.
(杨庆峰)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。