
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:基于全基因组和宏基因组测序数据集的抗生素耐药基因鉴定
【字体: 大 中 小 】 时间:2025年08月14日 来源:One Health Advances
编辑推荐:
这篇综述系统评述了抗生素耐药基因(ARG)检测的数据库与生物信息学工具进展,重点对比了CARD、NDARO等主流数据库的层级结构、更新机制及适用场景,并分析了DeepARG、HMD-ARG等机器学习工具在新型ARG预测中的优势。文章为研究者选择ARG资源提供了方法论指导,对推动抗微生物耐药性(AMR)监测具有重要意义。
抗生素耐药性(AMR)已成为全球健康危机,2021年直接导致114万人死亡。随着下一代测序技术(NGS)的发展,通过全基因组和宏基因组数据识别ARGs成为研究热点。本文系统梳理了ARG检测的数据库资源与计算工具,为不同研究场景提供选择策略。
ARG数据库可分为手动 curated 和整合型两大类。CARD采用抗生素耐药本体论(ARO)三级分类体系,包含实验验证的3000余条记录,其特色工具RGI支持多格式输入。NDARO整合了15,000条临床病原体数据,与AMRFinderPlus工具深度耦合。

SARG采用二级层级结构优化宏基因组分析,而MEGARes的"药物类别>机制>组别"三级分类特别适合耐药组丰度研究。值得注意的是,ARDB等早期数据库已停止更新,其数据被CARD等新平台吸收。
比对类工具:ResFinder通过K-mer比对快速识别已知ARGs,ABRicate支持7种数据库的BLAST筛查。ARGs-OAP的BLASTX/HMM双模式能有效处理复杂样本。
机器学习工具:DeepARG的SS/LS双模型对长短读长分别优化,准确率达97%。HMD-ARG采用多任务深度学习框架,可同步预测抗生素类别、耐药机制和移动性。PLM-ARG基于ESM-1b蛋白质语言模型,在低相似度ARG识别中表现突出。
集成平台:NanoARG专为纳米孔数据设计,可分析ARGs与金属抗性基因(MRGs)的共现模式。ARGpore2整合Centrifuge和MetaPhlan2,实现ARG宿主追踪。
当前主要问题包括:命名标准不统一(如argNorm的尝试)、突变型与获得型ARG数据库割裂、机器学习工具算力要求高等。未来需加强数据库动态更新机制,开发轻量化AI模型,并建立跨平台标准化评估体系。
(注:全文严格依据原文数据,未添加非文献内容,专业术语均保留原文大小写格式如DeepARG-SS、ESM-1b等)