利用群体关联建模和机器学习增强多重耐药微生物的诊断:开辟精准诊疗新路径

【字体: 时间:2025年03月27日 来源:Nature Communications 14.7

编辑推荐:

  在微生物耐药问题日益严峻的当下,为精准检测微生物耐药相关的基因型 - 表型关联,研究人员开展了群体关联模型(GAM)及机器学习(ML)的相关研究。结果显示 GAM 能精准识别耐药相关基因变异,GAM + ML 可提升耐药预测准确性,对指导耐药感染治疗意义重大。

  在当今医疗领域,微生物耐药问题犹如一颗 “定时炸弹”,严重威胁着人类的健康。由于基因突变、水平基因转移以及抗生素的过度使用,微生物耐药现象愈发普遍。这使得许多常用抗生素的疗效大打折扣,感染耐药微生物的患者治疗难度急剧增加,不仅治疗周期延长、医疗费用攀升,还可能导致病情恶化,引发更严重的耐药问题。
就拿结核病来说,其病原体结核分枝杆菌(Mtb)的耐药情况极为棘手。据统计,2021 年全球约有 1060 万新增结核病病例,160 万人因结核病死亡,其中 45 万例为耐利福平结核病(RR - TB),且多数同时对异烟肼耐药。准确判断 Mtb 的耐药性至关重要,因为普通结核病的治疗成功率可达 86%,而 RR - TB 和耐多药结核病(MDR - TB:RR - TB 加上至少异烟肼耐药)的治疗成功率却骤降至 57%。在新冠疫情期间,Mtb 耐药菌的传播因诊断不足和治疗失败而加剧,给全球公共卫生带来了巨大挑战。

目前,检测微生物耐药性的方法存在诸多缺陷。传统的基于培养的技术不仅耗时费力,需要数天至数周才能出结果,而且对于生长缓慢的细菌效果不佳;分子检测方法虽然速度较快,但只能识别已知的常见突变;DNA 测序虽能检测新的和罕见突变,却受限于已编目的与表型耐药相关突变的准确性。因此,开发一种能从分离株基因组信息中精准识别耐药表型的新方法迫在眉睫。

在此背景下,美国杜兰大学医学院细胞与分子诊断中心等机构的研究人员开展了一项关于利用群体关联建模和机器学习增强多重耐药微生物诊断的研究。该研究成果发表在《Nature Communications》上。

研究人员主要运用了以下关键技术方法:首先,从 CRyPTIC 数据库获取 12289 株 Mtb 的序列和药物敏感性测试(DST)数据,经筛选得到符合要求的数据集;接着,运用 GAM 分析,将耐药分离株按耐药谱分组,通过统计检验识别与耐药相关的基因变异;然后,对比 GAM 和全基因组关联研究(GWAS)的线性混合模型(LMM)的检测结果;最后,利用机器学习中的梯度提升算法优化预测模型,评估模型性能。

下面来详细看看研究结果:

  • 耐药分离株的群体特征:研究人员对 12288 个 CRyPTIC Mtb 基因组条目进行筛选,最终得到 7179 个用于分析的条目(DS2)。系统发育分析表明,DS2 分离株在 Mtb 四大主要谱系中分布较为均匀,减少了谱系偏差的影响。通过将 DS2 分离株按共享耐药谱分组,得到 126 个组,其中多数耐药分离株(86.6%)属于成员数≥14 的组。不同药物的耐药率存在差异,一线药物如利福平(67%)、异烟肼(74%)等耐药率较高,新的和重新利用的药物耐药率较低(6 - 23%)。
  • 与耐药表型相关的基因和突变的鉴定:GAM 分析成功识别出与 9 种一线和二线药物中 8 种相关的单基因关联,相比以往 GWAS 研究和无针对性的置信门控方法,减少了错误的基因靶点识别。与 LMM 相比,GAM 显著降低了假阳性率,尽管在检测新的和重新利用的药物耐药时敏感性较低,但在样本量充足的情况下,能更精准地检测到真实关联。此外,GAM 在分析 3942 株金黄色葡萄球菌(S. aureus)分离株时,也展现出良好的通用性,识别出了与部分药物耐药相关的 SNP 和水平基因转移机制。
  • 变异检测的优化以提高表型预测:研究人员将 GAM 识别的变异与 WHO 目录进行比较,发现 GAM 输出作为机器学习模型的输入可提高预测准确性。经筛选,梯度提升算法在 9 种药物的预测中表现最佳,其平均准确率达 81.0%,总体方差最低(1.66%)。GAM + ML 模型在预测利福平耐药时,阳性预测值(PPV)显著提高,特异性也有所增强,尤其对复杂耐药模式的药物预测敏感性提升明显。
  • 样本量和数据完整性对 GAM 的影响:研究表明,样本量与 GAM 检测到的真阳性基因数量呈渐近关系,LMM 虽能识别较多真阳性,但假阳性率极高。数据完整性方面,缺失耐药数据会影响 GAM 性能,不过机器学习模型可在一定程度上缓解这种影响,即便训练集数据量较小,也能利用大但不完整的数据集进行 GAM 分析。
  • GAM 和 WHO 变异数据在 ML 表型预测中的相对性能:以 GAM 和 WHO 变异数据作为梯度提升 ML 模型的输入进行分析,结果显示,GAM 输入的模型在预测多种药物耐药性时,准确率高于或与 WHO + 临时标准模型相当。在分析来自中国三家医院的 427 株 Mtb 分离株时,GAM + ML 模型在预测乙胺丁醇、乙硫异烟胺等多种药物耐药性方面表现更优,进一步证明 GAM 输入更适合用于基于 ML 的耐药预测模型。

在讨论部分,研究人员指出,GAM 在分析微生物耐药性方面具有显著优势。它能去除中性突变,减少交叉耐药假象,且无需依赖先验知识,可全面分析数据集中的所有变异。相比之下,当前 WHO 的方法主要针对 Mtb,依赖专家规则和先验知识,适用性较窄。GAM 的计算过程简单直接,还能为 ML 快速识别关键输入特征,有助于改善耐药微生物感染的治疗。

然而,GAM 也存在一定局限性。它对数据集质量要求较高,需要高质量的表型数据和多样化的耐药谱,否则可能导致分类偏差。此外,GAM 在识别基因组外耐药机制方面能力有限,难以检测如青霉素、红霉素等耐药相关的水平基因转移机制。不过,通过开发新的编码框架和运用机器学习方法,有望解决这些问题。

总体而言,该研究通过建立 GAM 并结合机器学习,为精准识别微生物耐药相关基因变异提供了有效方法,显著提升了耐药预测的准确性。这一成果对开发新的治疗方法、有效管理耐药感染具有重要意义,为未来解决微生物耐药问题开辟了新的方向,也为相关领域的研究提供了宝贵的参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号