DRAMMA:开启宏基因组数据中新型抗生素耐药基因检测的新征程

【字体: 时间:2025年03月08日 来源:Microbiome 13.8

编辑推荐:

  为解决抗生素耐药基因(ARGs)检测难题,研究人员开发 DRAMMA 方法,可预测新 ARGs,助力耐药研究。

  抗生素,这个在医疗领域立下赫赫战功的 “大英雄”,曾让无数感染性疾病 “闻风丧胆”。在外科手术、器官移植、癌症治疗等诸多关键医疗环节,它都是不可或缺的 “得力助手”。然而,长期过度使用抗生素,却让一些细菌逐渐 “进化” 出了耐药能力,成为了威胁人类健康的 “超级细菌”。据估算,2019 年全球有 495 万人的死亡与耐药菌感染相关,其中约 127 万人直接死于抗生素耐药菌感染,并且如果不加以控制,到 2050 年,这个数字预计将飙升至 1000 万。不仅如此,耐药问题还带来了沉重的经济负担,美国每年因一线抗生素治疗耐药需花费 200 亿美元,全球未来几十年的成本预计超 100 万亿美元。
面对如此严峻的形势,寻找可靠的监测手段来对抗抗生素耐药性迫在眉睫。目前,宏基因组数据在全球抗生素耐药组的研究中至关重要,虽然已有不少生物信息学工具用于 ARGs 注释,但大多依赖与预定义基因数据库的序列相似性,难以发现新型 ARGs。为了突破这一困境,来自以色列特拉维夫大学(Tel Aviv University)的 Ella Rannon、Sagi Shaashua 和 David Burstein 等研究人员开展了深入研究,相关成果发表在《Microbiome》杂志上。

研究人员采用了多种关键技术方法。在数据处理方面,从 NCBI 和 EBI 等多个公共数据库收集了来自不同生态系统的宏基因组和基因组数据,还构建了外部污水样本数据库。数据注释时,创建了 DRAMMA-HMM-DB 数据库用于标记已知 ARGs。在特征提取上,针对每个蛋白质提取了包括氨基酸特性、模式、水平基因转移(HGT)信号和基因组上下文等 4 类共 512 个特征。通过对比多种机器学习模型,最终选择随机森林模型,并利用其特征重要性进行特征选择和超参数优化。

研究结果如下:

  • 数据集编译:构建了庞大的数据集,涵盖来自多种生态系统的基因,其中已知 ARGs 通过 DRAMMA-HMM-DB 数据库注释,同时设置了阴性样本并去除重复蛋白质12
  • 模型性能评估:经五折交叉验证,DRAMMA 模型表现出色,平均受试者工作特征曲线下面积(ROC-AUC)为 0.98,平均精确率 - 召回率曲线下面积(PR-AUC)为 0.857。在不同分类数据集及外部验证集上测试,也展现出较高的准确性3
  • 候选分析:用训练好的模型对大量蛋白质分类,发现预测的 ARGs 在不同分类群和生态系统中分布广泛。其中,拟杆菌门 / 绿菌门(Bacteroidetes/Chlorobi)和 β- 变形菌纲(Betaproteobacteria)的 ARG 候选基因显著富集,且候选基因对 β- 内酰胺类抗生素耐药最为常见,主要耐药机制为靶点改变和抗生素失活4
  • 候选选择:通过一系列筛选步骤,确定了 681 个新型 ARG 候选基因,并对其进行深入分析和筛选,最终得到了最具研究价值的候选基因5

在结论与讨论部分,DRAMMA 能够在大规模基因组和宏基因组样本中快速识别已知和新型 ARGs,突破了传统基于序列方法的局限。该模型可检测与已知 ARGs 序列相似性低或无相似性的序列,有望发现更多新型 ARGs,为预防耐药基因在临床广泛传播争取时间,助力优化抗菌治疗方案。不过,研究也存在一些局限性,如训练数据的偏差可能影响模型对新耐药基因家族的识别,数据注释可能产生假阳性,且模型无法检测外排泵和点突变相关的耐药基因等。尽管如此,DRAMMA 的出现为抗生素耐药性研究开辟了新道路,为未来更深入地理解和应对抗生素耐药问题提供了有力的工具,有望推动全球健康医学领域的发展,在对抗抗生素耐药性的道路上迈出了重要一步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号