Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

热点追踪10个月前发布 Robin
55 0 0
广告也精彩

说起PubMed,很多小伙伴都非常熟悉,这应该算是国内最常用的生物医学相关SCI文献检索数据库,实验室的小白们一开始用的基本都是它。

最近,Nature的一篇报道文章称,就是这样一个广受好评的文献检索集大成者,被一款名为Papermill Alarm的软件工具查出,至少有1%的论文可能出自论文工厂。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

1%是个什么概念呢?

根据PubMed官网显示,该数据库收录了超过3400万篇生物医学文献,“至少1%”就意味着有超过34万篇论文可能涉嫌造假。

“这个数据太高了,令人担忧。”学术打假人Smut Clyde感叹道,“这些垃圾论文确实会被引用,人们利用它们来支持自己没有出路的研究项目。”

另一位学术打假人Elisabeth Bik则认为,PubMed上出自论文工厂的文章真实数量可能更高,“这些论文会损害科学的声誉和我们对研究论文的信任。”

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

近年来,被期刊撤销的论文数量不断增加,这些撤稿数据背后,论文工厂扮演了重要角色。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

2021年全球论文撤稿数据库把“paper mill”纳入到撤稿原因!这意味着,“论文工厂”造假论文,已经从学者猜疑、寻找证据、拿到证据、到完成确认并开始贴标签。

据统计,2022年1月1日到2022年12月31日期间,全球有5,488篇SCI撤稿,而中国撤稿数量竟达到了恐怖的2,879篇,占比数高达52%!

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

而导致中国论文撤稿的四个主要原因之一就是“论文工厂”,由于论文工厂原因导致撤稿的文章有多达900篇。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

在2019年及之前,即有论文因为“paper mill”被撤稿,但数量很少,一共才有7篇;2020年开始发力增加到160篇,2021年持续发力达到821篇,2022年突破900篇,而2023年仅过去四个月,数量已经达到93篇!

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

日渐规模化、工业化的学术作假手段正在侵袭科学界,打击论文工厂迫在眉睫。

近年来,大规模学术造假事件正在影响着出版商。

比如2021年初,Royal Society of Chemistry Advance期刊撤回了69篇涉嫌学术造假的论文,这些论文都没有共同的作者或机构,但是文中的图标和标题却惊人地相似。官方声明表示,该期刊也是这场“规模学术造假”骗局中的受害者。该期刊执行主编Laura Fisher意识到,一些论文工厂正在大量生产伪科学文章。

还有就是,去年9月份,Wiley发现了大规模的论文工厂活动并即时向行业发出警告。经过为期数月的调查,Hindawi成功揪出了一批暗中操控同行评议过程的问题审稿人和编辑团伙,并对旗下16家期刊的共计511篇文章予以撤稿。

由于“文章同行评议受损”,暂时停止出版特刊。因质量问题暂停Hindawi特刊,Wiley损失了900万美元的收入!

今年4月,Wiley提到,目前正在准备对另外约1200篇问题论文进行撤稿。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

目前,各个出版社已经开始围剿“论文工厂”的论文!标签为“paper mill”而撤稿还只是开始!

论文工厂造假论文的典型特征

(1)引用完全不相关的论文

故意把一些与论文主题关系不大或无关的文献作为参考文献,以装饰门面。

此外,还存在同时引用某位学者多篇文章的情况(如下图所示),这可能涉及引文交易。因为论文引用量对作者是有很大价值的,有助于促进基金申请、职位晋升等资源分配,因此出现了“强制引用”和“引用种植园”(citation plantations)等不端引用行为。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

(2)图像、表格数据在不同文章中反复使用

图像数据被重复使用,不仅限于蛋白质印迹、显微照片等,还包括表格、散点图、条形图,甚至是数字。原始数据图像的背景和内容可随意组合。

去年Retraction媒体平台就报道过,11篇论文共用同一张图片的事件。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

(3)存在套路造假模板

论文工厂的造假论文具有非常相似的结构或者共同的模板。一些完全不相关的论文,彼此间的文本、表格和图形整体布局和设计都很相似,而且重复使用数据。

比如,如下图所示多篇论文具有十分雷同的标题结构:

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

(公式化的论文标题结构)

(4)无法提供原始数据

如果怀疑论文造假,则要求作者提供原始数据。当作者被要求提交原始数据时,有些作者表示无法提交,有的作者干脆不回复。

有的则给了很明显是借口的理由,最无语的一个借口是,作者说他的孩子将咖啡倒在了电脑上,导致全部数据丢失,而且也没有备份。

(5)使用商业性、非学术机构的邮箱

所发现的虚假论文中,都只提供了个人邮箱(类似@126.com和@sina.com),并未提供机构来源的学术邮箱。而且,邮箱名称与作者的姓名毫无关联。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

(6)甩锅研究生

有些通讯作者会将责任归为一位研究生产出了“有问题”的数据,而且该学生已经得到了“惩罚”。然而,期刊并没有收到官方证据表明某个学生得到了“惩罚”,以及确切的学术不端行为和“惩罚”到底是什么。显然,通讯作者没有意识到自己对整个团队负有主要责任。

Nature:全球知名数据库中超34万篇论文涉嫌造假!造假论文有哪些特征?

本文资料参考自科研bubble,科研Z库,科学网,Hanson临床科研,For Better Science等,仅用于分享,版权归原作者所有。

© 版权声明
广告也精彩

相关文章

广告也精彩

暂无评论

暂无评论...