综述:基于全基因组和宏基因组测序数据集的抗生素耐药基因鉴定

【字体: 时间:2025年08月14日 来源:One Health Advances

编辑推荐:

  这篇综述系统评述了抗生素耐药基因(ARG)检测的数据库与生物信息学工具进展,重点对比了CARD、NDARO等主流数据库的层级结构、更新机制及适用场景,并分析了DeepARG、HMD-ARG等机器学习工具在新型ARG预测中的优势。文章为研究者选择ARG资源提供了方法论指导,对推动抗微生物耐药性(AMR)监测具有重要意义。

引言

抗生素耐药性(AMR)已成为全球健康危机,2021年直接导致114万人死亡。随着下一代测序技术(NGS)的发展,通过全基因组和宏基因组数据识别ARGs成为研究热点。本文系统梳理了ARG检测的数据库资源与计算工具,为不同研究场景提供选择策略。

ARG检测的生物信息学数据库

ARG数据库可分为手动 curated 和整合型两大类。CARD采用抗生素耐药本体论(ARO)三级分类体系,包含实验验证的3000余条记录,其特色工具RGI支持多格式输入。NDARO整合了15,000条临床病原体数据,与AMRFinderPlus工具深度耦合。

SARG采用二级层级结构优化宏基因组分析,而MEGARes的"药物类别>机制>组别"三级分类特别适合耐药组丰度研究。值得注意的是,ARDB等早期数据库已停止更新,其数据被CARD等新平台吸收。

ARG检测的计算工具

比对类工具:ResFinder通过K-mer比对快速识别已知ARGs,ABRicate支持7种数据库的BLAST筛查。ARGs-OAP的BLASTX/HMM双模式能有效处理复杂样本。

机器学习工具:DeepARG的SS/LS双模型对长短读长分别优化,准确率达97%。HMD-ARG采用多任务深度学习框架,可同步预测抗生素类别、耐药机制和移动性。PLM-ARG基于ESM-1b蛋白质语言模型,在低相似度ARG识别中表现突出。

集成平台:NanoARG专为纳米孔数据设计,可分析ARGs与金属抗性基因(MRGs)的共现模式。ARGpore2整合Centrifuge和MetaPhlan2,实现ARG宿主追踪。

挑战与展望

当前主要问题包括:命名标准不统一(如argNorm的尝试)、突变型与获得型ARG数据库割裂、机器学习工具算力要求高等。未来需加强数据库动态更新机制,开发轻量化AI模型,并建立跨平台标准化评估体系。

(注:全文严格依据原文数据,未添加非文献内容,专业术语均保留原文大小写格式如DeepARG-SS、ESM-1b等)

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号