Nature:这款软件可以看出文章是否出自“论文工厂”!

热点追踪9个月前发布 Robin
56 0 0
广告也精彩

近日,Nature报道了一种分析科学论文的标题和摘要、并检测是否与“论文工厂”中有相似文本的软件工具正引起出版商的兴趣。

Nature:这款软件可以看出文章是否出自“论文工厂”!

该工具名为Papermill Alarm,是由伦敦学术数据服务公司 Clear Skies 的主管 Adam Day 开发的。Adam Day说,他通过该系统对引文数据库PubMed中列出的所有标题进行检测,发现目前列出的论文中有1%的文字与论文工厂(按订单完成科学手稿的公司或个人)写作的文章非常相似。Papermill Alarm 并没有明确指出一篇文章是否是伪造的,而是标记出那些值得进一步调查的文章。

Nature:这款软件可以看出文章是否出自“论文工厂”!

Adam Day 表示,软件的分析只能识别与已知论文工厂相似的论文,所以并非旨在估计 PubMed 条目中论文创作的规模。他说,“这就像一张渔网而并非钓鱼竿”。此外,合法的论文也可能因为有类似的措辞而被标记。

来自柏林自由大学,研究论文工厂的经济学家Anna Abalkina说,这种发现潜在虚假论文的自动检查能让科学界从中受益。

可疑的提交材料

许多出版商已经通过使用软件和其他方法,来帮助检测欺瞒行为以及发现垃圾论文。例如,一些稿件处理系统可以检测大量稿件是否来自同一台计算机——这表明一个人或组织可能正在大量进行研究,并进行标记。但Adam Day宣称,他分析文本的方法是全新的。六家出版商,包括位于加利福尼亚州千橡市的 SAGE公司(AdamDay在该公司担任数据科学家),他们已表示有兴趣使用 Papermill Alarm 来筛选提交的稿件。

该工具使用一种深度学习算法,将稿件的标题和摘要中使用的语言与已知来自论文工厂的论文中使用的语言进行比较。这种比较基于论文工厂的论文清单,这份清单是由包括Elisabeth Bik和David Bimler(笔名Smut Clyde)在内的“科学打假斗士”们汇编的。该工具使用一套类似交通信号灯的预警系统——对与已知论文工厂论有许多相似之处的论文授予红灯,对有一些相似之处的论文授予黄灯,对没有相似之处的论文授予绿灯。

到目前为止,几乎没有对关于论文工厂的论文流行程度的估计。英国伊斯特利出版伦理委员会6月的一份报告表明,提交给期刊的论文中有2%来自论文工厂,并表示这个问题 "有可能威胁到相当多的期刊的编辑过程"。

David Bimler 说,即使Adam Day 发现已发表的PubMed论文中有1%来自论文工厂,也 “太高了,让人不舒服”。“这些垃圾论文确实会被引用。人们利用它们来支持自己的不好的想法,并维持死气沉沉的研究计划。”他补充道。

Elisabeth Bik 说,PubMed 中列出的论文工厂论文的实际数量可能更高,但她指出,这些论文对科学的整体影响可能很低,因为其中大多数都没有被高度引用或有影响力。她说,“但这损害了科学的声誉以及我们对研究论文的信任。”

© 版权声明
广告也精彩

相关文章

广告也精彩

暂无评论

暂无评论...