打开网易新闻 查看更多图片

作者 | 朱秋雨

来源 | 看世界杂志

英国皇家化学学会(RSC)

工业化批量生产的论文特征包括:非学术性的电子邮件地址,作者在被问及时无法提供原始数据,以及文内糟糕的英语表达。

顶级国际期刊出现批量复制粘贴的论文,如何辨别并“打假”,成为国际编辑界头疼的难题。《自然》杂志3月下旬发布文章表示,为打击“论文工厂”生产出的假论文,应尽快实施更严苛的审查制度——编辑应当要求作者提供原始数据;期刊雇专人检查论文内的图表。

相同布局的条形图,相似的文章大纲,不同小标题下的类似内容……在论文“打假人”眼里,这些稿件都由通用模板制作而成——只需将文字和图片稍加调整,即可生产出截然不同的文章。

据《自然》统计,自2020年1月以来,共有370篇稿件因被怀疑来自“论文工厂”被各大期刊社撤稿。有研究者指出,“垃圾论文”的增加,对学者的可信度会因此遭到破坏,“正削弱我们对科研团队其他稿件的信心”。

世界最大的科学出版商爱思唯尔的服务商认为,学术界有组织的欺诈问题并不新鲜,也不限于中国。“我们已经从其他几个国家发现工业化作弊的证据。”而截至2021年3月,据《自然》统计,已有约1300篇论文由“论文工厂”生产。

打开网易新闻 查看更多图片

《自然》杂志

医学论文重灾区

2021年初,《英国皇家化学学会》(RSC)的编辑劳拉·费舍尔宣布,将从该杂志撤回68篇论文。理由是在2020年1月,费舍尔发现其收到的多篇论文有相似之处。

经过一年的自查,RSC公布了让人大跌眼镜的撤稿声明,宣称它已成为“系统生产欺诈科学研究”的受害者。

来自旧金山、专门从事纠偏“论文工厂”行径的前斯坦福教授伊丽莎白·比克对此评价称,RSC的公告因其开放性而意义重大。“这么多论文都是假的,这对于该期刊相当尴尬。为他们承认上当受骗点赞。”她说。

比克是造假论文的“杀手”,以专查图像抄袭为长。2020年2月,她曾联合其他三名专家发布了一份包含400多篇论文的清单,指出这些文章可能均来自同一个“论文工厂”。因文内都出现雷同的“蝌蚪”图像,他们将其命名为“蝌蚪厂”。当年7月,比克又发现了121篇论文来自另外一家“论文工厂”。

伊丽莎白·比克(Elisabeth Bik)

“(它们)单独来看,是非常合理的,”比克认为,“只有当大量比较这些论文时,你才开始发现,它们高度相似。”

统一的“论文制造”有什么特征呢?2021年2月,声称遭受“论文工厂”迫害的医学期刊《药理学档案》发表社论总结:工业化批量生产的论文特征包括:非学术性的电子邮件地址,作者在被问及时无法提供原始数据,以及文内糟糕的英语表达。

该杂志报告称,其所有投稿中约有5%来自论文工厂,且正在撤回10项已公开的研究。

在这其中,医学论文成为此次国际期刊界大查重的最主要领域。这些由通用模板制作而成的论文,虽然微调了文章单词和图像,却有很大雷同——拥有相同背景及可疑平滑轮廓的蛋白免疫印迹;来自不同实验却得出相似的条形图;不同主题下的相似内容。

造假论文中的图像抄袭示例

悉尼大学的分子肿瘤学研究员詹妮弗·拜恩发现,疑似由论文工厂生产出的文章,实验细节经常会列出不正确的核苷酸序列或试剂,因此所描述的实验不可能发生。她表示,这些论文很可能只是简单地通过调换癌症类型或篡改研究中涉及的基因,就产生不一样的结论。

与比克合作揭露论文工厂的学者伍兹则担心,一些论文宣称在重要领域取得了可喜的成果,这些伪造的结果会掩盖掉人们对结果较为平淡但真实的研究的关注。

“基于假论文的发现,人类的癌症已经被战胜了,”伍兹说,“它们可能会给患者带来虚假的希望。这样的结果是我无法忍受的。”

“论文工厂”地震连连

问题论文的盛行,影响了医院研究人员的声誉。《分子治疗》杂志在2021年2月发表社论表示:“‘垃圾科学’的数量不断增加,将对来自事发地区其他研究的可信度造成破坏,期刊界会越来越多地对来自该地区的科学研究产生怀疑。”

“论文工厂”过去曾几次引发国际学术圈“地震”。2017年,癌症杂志《肿瘤生物学》公布,将撤回已发布的107篇医学论文,理由是发现批量生产的伪造论文。而期刊《肿瘤生物学》也自当年7月起,不再被SCI收录。

打开网易新闻 查看更多图片

《肿瘤生物学》

值得一提的是,《肿瘤生物学》107篇论文的丑闻发生后,有对事件的调查结果显示,论文的同行评审大多是捏造的,部分论文由第三方公司制作而成。

《自然》则指出,医生通常需要发表研究论文才能获得晋升,但由于医院工作繁忙,他们可能缺乏时间做科研。在这一情况下,学术不端的代写工厂满足了该群体的痛点。

如何甄别“流水线”论文?

在常人的理解里,甄别假论文是一个最基本的学术操作。但国际期刊的编辑却认为,“论文工厂”生产出的学术文章屡禁不止,与背后的整个系统有关。

保持审稿的隐私和独立性,是各大期刊的共识。于是,很常见的窘境是——如果某期刊拒绝了他们认定为伪造的稿件,这些稿件仍可能在其他地方发表。

这一窘境成立的前提在于:作者有权利将同一稿件提交给多家期刊。而由于各大期刊之间分享信息的能力有限,期刊编辑对于分享有关作者的信息持谨慎态度。这些信息有可能是诽谤性的,且数据保护规则阻碍了对作者数据的共享。

自2020年1月以来,独立调查人员和期刊已经标记出超过1000份可能与 “论文工厂” 有关的论文(来源:《自然》)

这样的规则容易造成“滚雪球”效应。一旦欺诈者知道其论文在某特定期刊上容易被接纳,他们便可能会持续投稿。

《自然》指出,这即是为什么一些期刊明显受“论文工厂”影响更大的缘由。例如,自2020年1月以来,《欧洲医学和药理学评论》已经撤回了186篇文章。“我们对调查结果感到震惊。”其主编在受访时表示。

而近年来批量撤稿丑闻再度引发学术界愤怒之际,国际期刊界开始绞尽脑汁地思考:如何甄别并“打假”猖獗的“论文工厂”。

2020年9月,国际出版伦理委员会(COPE)举办了一场主题为“‘论文工厂’系统性地操纵出版市场”的论坛。比克作为主讲人,列举了编辑们需要注意的危险信号,如注意来自特定医院的论文,以及电子邮件地址与任何作者姓名均没有关联的稿件。

假论文的出现,同时重塑了期刊界的工作与审查模式。总部在荷兰的爱思唯尔旗下部分期刊宣布,他们因此会尽量避免发布那些“论文工厂”极为擅长的主题论文。几家知名出版商则表示,他们的许多期刊已经更新政策,要求作者在投稿时出示实验背后的原始数据。

部分期刊开始雇用分析员,专门审查期刊不同论文间雷同的图像。还有的出版商,将希望放在计算机技术上——雇佣研发团队开发能有效识别重复图像的软件。

比克的团队发现,在有些论文的免疫印迹实验中,增强对比后,所有条带段具有相同的背景,没有任何常规实验中会出现的的污迹

只是,这些保障措施似乎并不是无懈可击。“要求提供原始数据并不是绝对的保证,因为人们大可以伪造数据。”泰勒-弗朗西斯出版集团(Taylor & Francis Group)出版诚信和道德总监Sabina Alam说。而要做到用软件识别“论文工厂”,还需建立庞大的图像共享数据库,以此让出版商查重。

如同受骗上当的《英国皇家化学学会》所大声呼吁的:“科学出版社是时候需要协调一致的努力,杜绝伪造的研究了。”只是,当假论文成为国际出版界的一大痛点时,需要反思和做出努力的,远不止国际期刊界自身。

打开网易新闻 查看更多图片