两本杂志中被高度引用的遗传学研究发现包含序列错误

【字体: 时间:2023年02月14日 来源:nature

  
Deoxyribose nucleic acid (DNA) sequencing on a computer screen displayed in yellow, white and blue          

分析发现,几篇论文在试剂的DNA或RNA序列中存在错误。

根据对发表在两家高影响力期刊上的癌症遗传学论文的分析,在已发表的基因研究中,错误的普遍程度可能比以前想象的要大。

通过对数百篇论文的补充信息进行梳理,澳大利亚悉尼大学的癌症研究人员Jennifer Byrne领导的一个团队发现了一些被高度引用的研究,这些研究在试剂的DNA或RNA序列中包含错误。科学家们出于各种原因使用这些试剂——例如,研究给定基因或基因序列在疾病中的功能——如果序列被错误地报告,可能会影响研究的可重复性。

目前尚不清楚这些错误是意外还是行为不当。这项研究于2月3日发表在预印本服务器bioRxiv上,尚未经过同行评审。一些研究人员还质疑单个核苷酸水平上的错误会在多大程度上影响论文的结论。然而,大多数人都认为,科学文献中出现的这种错误令人担忧。

德克萨斯州休斯顿贝勒医学院的分子生物学家Jeremy Wilusz说:“看到这样的错误确实令人沮丧。如果这只是一个报道问题或更大的问题,我不知道,但这不应该发生。”

搜索错误

Byrne和她的团队在2015年发现了一些关于这个问题的论文后,一直在科学文献中寻找基因序列错误。2021年,Byrne和她的同事们使用Seek & Blastn分析了《Gene and Oncology 》杂志上的近1.2万篇论文。Seek & Blastn是一种软件工具,可以提取论文中提到的短核苷酸序列,发现潜在的错误,并与被称为Blastn的公共核苷酸数据库进行交叉检查。他们发现有700多篇论文报告了实验试剂的RNA或DNA序列存在错误。

在最新的研究中,该团队想要调查影响因子相对较高的期刊——这是一种基于引用的衡量方法,被一些人用作期刊影响力和声望的代表。Byrne说:“可以说,人们更关注的是影响因子更高的文学作品。”

研究人员集中研究了发表在两种期刊上的癌症遗传学论文:《分子癌症》(Molecular Cancer)和《致癌基因》(Oncogene)。在之前的分析中,他们在这两种期刊上发现了一些序列不正确的论文。(这两份杂志都由施普林格Nature出版,《Nature》的新闻团队独立于出版商。)

Byrne和她的同事在2014年、2015年、2018年和2020年发表的334篇分子癌症论文中手动筛选了声称针对未修饰的人类基因或基因组序列的试剂。(因为论文中的核苷酸序列试剂是在补充文件中报告的,而不是在正文中,研究小组无法使用Seek & Blastn工具。)

研究小组在分析的6647个核苷酸序列中发现了253个(3.8%)错误。错误分布在334篇手稿中的92篇,每篇论文的问题序列中位数为2个。核苷酸序列错误论文的比例从2016年的10%到2020年的38%不等。Byrne说:“对我们来说,最大的意外是2020年错误论文的比例。我们没想到会这样。”

对于《致癌基因》杂志上的论文,该团队进行了更有针对性的搜索,精确定位了2020年发表的包含环状RNA或microRNA的论文,这些术语与研究人员在《分子癌症》杂志上发现的论文有关。在他们筛选的1165个序列中,有50个包含错误。在分析的42篇论文中,有21篇发现了这些问题。

比利时根特大学的癌症研究员Jo Vandesompele说:“我们都知道这种情况,但我对这个问题的严重程度感到惊讶。”他补充说,在环状RNA研究中存在一些已知的问题,比如环状rna序列数据库的不完整和不一致,这可能会使这类问题更容易被忽略。

Byrne团队标记的论文被高度引用:92篇分子癌症论文被引用8048次,21篇致癌基因论文被引用878次。其中一些论文被引用超过100次。

诚实的错误?

Byrne承认,分析中标记的一些错误可能是无意的。其他研究人员指出,也有可能一些错误对论文的整体结论影响不大。一些人告诉《Nature》杂志,一个序列中的一两个核苷酸变化并不会使试剂完全功能失调——在某些条件下,它可能仍然适用于常用的实验室技术,如聚合酶链式反应(PCR)。

位于德国海德堡的欧洲分子生物学组织的科学出版物负责人Bernd粉末说,不管错误的起源是什么,它们出现在已发表的文献中是一个问题。他说:“错误是有害的,因为人们不能依赖这些论文作为未来研究的基础。”

Byrne和她的团队表示,许多错误的性质让他们看起来很可疑。他们发现,一些据称靶向人类基因或基因组序列的试剂在人类基因组中没有可识别的靶点,而一些靶向序列在其他物种中,如啮齿动物、植物和真菌。

Vandesompele说:“它们与预定目标没有完美匹配,这肯定非常令人担忧。”他补充说,尽管研究人员可能能够使用有一两个错误的试剂用PCR扩增序列,但这种错误可能会损害试剂的选择性或特异性,并且“这只是常识”,不设计有错配的试剂。

Byrne说,另一个需要考虑的因素是,大约三分之一的分子癌症论文和大约四分之一的癌基因论文被确定为有错误,也在发表后的同行评审平台PubPeer上被标记出来,主要是由于单独的图像完整性问题。

施普林格Nature的研究诚信主管Chris Graf说:“这两家杂志的总编辑以及施普林格Nature都同意Byrne教授的观点,即确保发表记录的完整性是至关重要的,我们非常认真地对待发表在我们期刊上的论文引起的关注。一年多以前,我们就要求提供这些问题的细节,以便进行调查,并在适当的时候采取行动,但直到现在我们才得到这些信息。现在我们确实有了证据,我们可以开始全面调查。”他补充说,“如果担忧被证明是有根据的,我们将采取行动。”

Graf说,已经对2021年分析中标记的两篇《分子癌症》论文进行了调查,尽管在两种试剂序列中的排印错误得到验证后,其中一篇论文得到了更正,但第二篇论文中标记的“错误”与预期的基因和物种匹配。Byrne断言他们仍然是不正确的。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号