Retraction Watch 的 Ivan Oransky 谈到论文工厂时说,“他们就像许多隐藏的犯罪集团一样,很多时候我们不知道他们会做什么。” 他们是在科学期刊史上发生过的规模最大并有组织的造假行为,损害了科学家与出版商之间的相互信任。
虽然剽窃和造假并不是什么新鲜事,个别研究人员也被抓到使用软件PS图像或篡改数据,但论文工厂为他们的客户提供产业链式的专业造假服务,影响更大,破坏力更强。买家可以选择任何主题的论文或论文的作者身份,而这些论文的结论都是虚假的,然后投给期刊。这不仅使他们更难被发现和打击,而且他们可能造成的破坏也成倍增加。
他们的运作模式在 2020 年初开始初见端倪。两个独立的图像专家小组发现了许多文章,它们来自不同机构的不同作者,从事不同的生物医学领域研究,似乎有奇怪的一致之处,即他们好像都使用过相同的库存图片。该系列出现在近 600 篇文章中。几个月后又发现了另一系列 125 篇文章。据科研“打假专家” Elisabeth Bik 估计,尚未发现或可能永远也不会发现的经过专业处理的论文数量可能是已发现数据的 10 倍。
Taylor & Francis (T&F) 道德和诚信主管Sabina Alam表示,以前从未见过如此大规模的图像处理或库存图像的使用。Portland Press称其为“新的、严重的造假信息大流行”,在不到一年的时间里,他们拒绝了 600 多篇疑似论文工厂的文章。
不为人知的一面
论文工厂是科学出版界的论文加工厂。这里所进行的并不是学生们花费几百英镑买一份代写的学期论文来提高他们的分数那样简单,而是学者们花费比这高出 100 倍的价钱来购买一篇研究论文,并假装这是他们自己的作品,而且还可以保证出版。这些论文中的研究完全是编造的,是从真正的研究中抄袭的还是通过某种方式篡改的,目前尚不清楚。这是论文工厂的众多未解之谜之一。
寻找论文工厂看似简单实则很难。Elsevier出版服务总监Catriona Fennell发现了一家疑似出售作者身份的公司。根据他们的网站可以判定他们位于英国伦敦。“但电话号码却来自越南,服务器在巴基斯坦。你甚至都不知道该向哪国政府举报?”芬内尔想起某些研究人员曾说过,“其中一些论文工厂甚至都没有网站,他们行走在大学里面对面招揽生意”。
2013 年,《科学》和《经济学人》都首次报道了大规模的作者身份销售业务。“你可能不会相信:你可以在不做实验的情况下发表 SCI 论文 ”。这是被《科学》发现的某个企业的网站上的一条广告。
当记者联系时,许多公司声称他们只提供校对、编辑和翻译等合法服务。“在某些时候,这些公司或其他公司都意识到自己出售论文可以比表面业务赚更多的钱,” Oransky阐述道。
一些期刊发现,一旦一篇文章被接受,研究人员就会要求对作者身份进行重大更改,甚至于最终的一组作者与提交作品的一组作者没有共同之处。尽管如此,通讯作者的电子邮件地址有时会保持不变,尽管据称属于不同的人。“对我们来说,这是一个很大的暗示,表明 [论文] 已被出售,可能卖给了出价更高者。” Alam说。“也许一旦被接受,价格就会上涨。”
库存论文 stock paper
论文工厂如此难以察觉的原因在于,他们的操作非常微妙,几乎不可能通过查看单个文章就能发现。他们的区别通常只有在比较几篇论文后才会变得显而易见。“如果我们回到大约 10 年前,最常见的是论文中的图像本身被改动,例如图像被翻转了或者对比度被改变了。” Alam说。通常,这种造假来自同一个研究人员或同一机构。
T&F 第一次面对论文工厂时,他们调查了数百篇论文,最终发现有好几篇论文中出现了类似的而且超乎完美的图像,而这些文章都来自不相关的作者,涵盖不同的主题。“我们认为这些可能是库存图片,”Alam 解释道。
这种操作手法可以让论文工厂在编辑所知的图像信息以及基本的查重软件下肆虐发展。“他们避免明显的文字剽窃之类的事情,”芬内尔说。“举个例子,相类似的图片可以出现在不同的作者之间,甚至出现在不同主题的文章中,而只是对数轴或数据进行了变更。” 英国皇家化学学会期刊 RSC Advances 的执行主编LAURA FISHER解释说, “就其本身而言,图表看起来是合理的,但当你开始在一系列不同的论文中看到几乎相同的图表时,就会开始怀疑了。”
2020 年初发现的大型论文工厂的案例中,第三方公司发现了可疑的Western blot图像。Western blot是检测细胞或组织中特定蛋白质的常用技术。“这不是我们所能理解的复制,他复制的不是Western blot条带本身,而是它的背景,”Bik 说到。这应该是出现在数百篇专注于癌细胞中各种蛋白质和 RNA 调节的生化论文中随机噪声因子的复制模式。
Source: Retracted 2017 & 2018 Royal Society of Chemistry papers
The two western blots here come from unrelated papers with different authors but the bottom GADPH row appears to be identical in both
但仅仅依靠怀疑是不能撤稿的。“撤稿是非常严肃的一步,也是不可逆的,” RSC 质量和道德出版经理 Nicola Nugent 说。“我们必须做到理由充分。” 大多数出版商都遵循出版道德委员会 (COPE) 关于调查潜在造假行为的严格指导方针—尽管如此, Alam 指出 COPE 的标准不一定涵盖如此大规模的涉嫌造假操纵。
出版商要求作者提供原始数据以确认文章的结论,无外乎以下两种方式:要么作者根本没有回应,要么即使在 Covid 时期,他们也以惊人的速度做出回答。“另一个奇怪的是,我们得到的所有回答都有相似的措辞,尽管从技术上讲,它们来自不同的作者,” Alam说到。出版商设法获得的原始数据要么是混乱的,几十份文件都没有一个没有清晰分类,要么只是文章中图像的副本。
期刊撤稿的决定很少受到争议。一些作者从未打破沉默,而另一些作者则同意撤回,因为他们发现了可能存在的“数据问题”。在 T&F 的案例中,这个消息似乎已经传开了。“我们从未联系过的作者开始主动联系我们,而他们的文章类似论文工厂的作风,” Alam说。“他们联系我们说他们在论文中发现了一些问题,他们需要撤回。”
RSC 的调查花了将近一年的时间才完成,最终 70 篇论文被撤稿。目前为止,Wiley 撤稿了 55 篇文章,T&F 大约 40 篇,Portland Press 31 篇。
医学研究 docotored research
2020 年期间发现的论文工厂的文章大多出自中国医院的研究人员。就跟许多其他国家一样,科学家发表论文以此来获得职业晋升。但是对于中国的研究人员来说,由于评估科学贡献的时候,文章发表占据重要位置,因此这种激励措施尤为凸显。“这种所谓的出版或腐朽文化的驱动因素之一是需要在同行评审的期刊上发表文章,这使得人们不得不去追求出版。”Nugent说。
对于中国的医生来说,他们的整个职业生涯可能都取决于在国际期刊上发表文章。“这些是临床医生,他们对研究不感兴趣,他们想帮助患者,”Bik说。“他们的日程安排中没有时间做研究,而且他们通常不在有研究设施的医院工作,他们没有经费做研究。”
在 For Better Science 博客上,Tiger BB8发现了数百篇可疑文章。他们曾收到一封电子邮件,很显然该电子邮件来自一位几近崩溃的年轻医生。‘没有论文,你就得不到晋升;没有升职,你几乎无法养家糊口,”该邮件中写到。忙碌于照顾病人和陪伴孩子之间,即使愿意,也没有时间做研究。”
根据《科学》杂志 2013 年的调查,医生为获得文章的作者身份,需要支付 1600 美元(1150 英镑)到近 15,000 美元不等的费用。最负盛名的造假论文的作者身份价值约为 26,000 美元,超过了中国一些助理教授的年薪。2013 年的一项分析估计,总体而言,中国的代笔行业在 2011 年创造了 446 万美元的收入。
Source: Retracted 2018 Royal Society of Chemistry papers
Histologic sections of kidney tissue from two unrelated papers (top/bottom) with no authors in common. Three of the slides are duplicates that have been repositioned and rotated
在 2017-2018 年,中国对参与造假的研究人员进行了严厉惩罚,并全面改变政策以杜绝学术不端行为。浙江大学的通信科学家卢建平的分析发现,政策的执行仍然很少。
来自同一个国家的如此多的造假行为的问题还在于,它会破坏科学的开放性,并使研究人员忽视中国科学家的真实工作。“我还担心它会威胁科学多样性,”Fennell说。“如果人们不确定该信任什么内容,人们可能会开始对某些国家的研究进行归类。”
Arms Race
由于对论文工厂知之甚少,目前不可能从源头上阻止他们。因此,出版商现在正试图阻断更多的造假文章污染科学文献。
RSC 引入了内部模式检查,可以识别使用模板编写的文章,增加了编辑培训,并对Western blot等数据设置了更严格的要求。与其他化学出版商分享从论文工厂事件中获得的经验,RSC 还在探索协作性可能,例如可疑造假文章的早期预警系统。
Springer Nature 已经开发了一个允许跨期刊审查的数据库,该出版商的研究诚信主管 Suzanne Farley 说, “从大约 2000 种期刊中拉取信息,该数据库通过识别网络中的电子邮箱地址、作者/同行审稿人姓名以及疑似论文工厂提交的文章标题,在新稿提交时就标记此类文章。” 她解释道。出版商还在研究如何在不影响数据保护的情况下共享他们之间对学术不端行为所查找到的信息。
许多出版商与期刊外的图像专家合作,或者像 Wiley 一样成立了自己的图像鉴别团队。“这个团队目前为24种以上的种期刊鉴别图像,” Wiley 的研究诚信和出版道德总监 Chris Graf 说, “到目前为止,他们抢在文章发表之前已经筛选了近 2000 篇文章。” T&F 还试用了软件来发现造假数据,但 Alam 指出,他们还没有找到可以识别库存图像以及更直接的 photoshopping 的程序.
尽管如此,Fennell指出,我们对于论文工厂的威慑力有天然阻碍。例如每次提交都需要提交原始数据,使本已繁琐的出版流程对于真正的研究人员来说变得更加复杂。“我们一直在努力寻找平衡,不要因为少数人的行为而使多数人受牵连。你最不想做的就是因为一个碰巧的共同特征,而拒绝真正作者的真实文章。
Oransky 说,期刊可能只需要面对这样一个现实,即加强质量控制意味着文章的发表数量会越来越少。他赞扬那些对造假文章进行过调查并撤稿的出版商。“我更担忧的是那些没有对造假文章进行撤稿的出版商。”他说。
让打击造假文章成为科学史的一部分,不仅会削弱研究人员对彼此工作的信任,还会损害公众对已发表数据的信任。“如果有人发表了一篇论文,说某种药物可以用于某种治疗,而有人接着这一结果进一步研究,那么它就有可能拖垮正常研究的速度。”Fisher说。
参考文献:
https://www.chemistryworld.com/news/publishers-grapple-with-an-invisible-foe-as-huge-organised-fraud-hits-scientific-journals/4013652.article
|