通过将MALDI-TOF质谱技术与人工神经网络相结合,加速检测艰难梭菌37序列型

《Microbiology Spectrum》:Accelerated detection of Clostridioides difficile sequence type 37 by integrating MALDI-TOF mass spectrometry with artificial neural network

【字体: 时间:2025年11月16日 来源:Microbiology Spectrum 3.8

编辑推荐:

  艰难梭菌ST37(RT017)是导致严重感染和抗生素耐药的关键亚型,传统检测耗时长达5-6天。本研究通过整合MALDI-TOF质谱数据与人工神经网络(ANN),构建了可在10秒内快速区分ST37和非ST37的模型。基于1155条质谱数据(385株临床分离株),模型在训练集和验证集均表现出高精度(AUROC达0.96-0.99),并识别出15个潜在生物标志物。该方案显著缩短检测周期,提升临床诊断效率,为感染控制提供新工具。

在临床医学领域,快速准确地识别致病菌是确保及时治疗和有效控制感染的关键。特别是对于**Clostridioides difficile**(艰难梭菌)序列类型37(ST37,也称为RT017)这一高度致病的菌株,其与严重感染和抗生素耐药性密切相关,因此对其快速检测的需求尤为迫切。当前的检测方法通常较为繁琐且成本高昂,这限制了其在临床环境中的广泛应用。为了克服这些局限,研究人员探索了结合**基质辅助激光解吸电离飞行时间质谱**(MALDI-TOF MS)与**人工智能技术**,尤其是**人工神经网络**(ANN)模型的检测方案。这种方法不仅提升了检测效率,还显著降低了成本,为临床诊断和感染控制提供了新的可能性。

本研究收集了来自多个地区的385株临床分离的艰难梭菌,其中包括118株ST37菌株(占30.65%)和267株非ST37菌株(占69.35%)。通过使用MALDI-TOF MS获取的1,155条质谱数据,构建了一个基于ANN的分类模型。该模型采用80%的数据进行训练,20%的数据用于外部验证,结果表明其在检测ST37菌株方面表现出卓越的诊断精度和可靠的泛化能力。在验证集上,模型的**受试者工作特征曲线下面积**(AUROC)达到0.96,**精确率-召回率曲线下面积**(AUPRC)为0.94,表明其在实际应用中具有很高的可行性。

此外,研究还识别出了15个可能作为ST37菌株标志物的质谱峰,这些峰的质荷比分别为6,729、12,013、12,012、6,731、7,296、12,085、14,716、7,292、3,104、7,293、16,966、15,360、7,259、18,488和14,660 Da。这些标志物为未来研究提供了潜在的方向,同时也为临床快速筛查ST37菌株提供了重要的参考依据。

传统的艰难梭菌检测流程通常需要5至6天,包括细菌培养、MALDI-TOF分析、DNA提取、PCR扩增和测序分析等步骤。然而,这些步骤不仅耗时,还对实验室资源和人力资源提出了较高的要求。相比之下,基于MALDI-TOF MS和ANN模型的检测方法可以在短短10秒内完成ST37菌株的初步分类,大幅缩短了诊断时间。这种快速检测能力对于临床医生及时制定治疗方案至关重要,尤其是在面对严重感染时,能够显著降低患者的病情恶化风险。

从研究背景来看,ST37菌株在亚洲地区尤为常见,特别是在泰国和印度尼西亚等国家,其在致病菌中的占比高达30%至42%。而该菌株对多种抗生素表现出耐药性,如氟喹诺酮类和克林霉素,这些药物在某些情况下反而可能促进艰难梭菌的增殖。因此,快速识别ST37菌株不仅有助于临床医生及时调整治疗方案,还能有效防止感染的进一步扩散。研究团队通过构建一个能够直接从培养菌落中识别ST37菌株的模型,使得检测流程更加高效且具有实际操作性。

在模型的构建过程中,研究团队采用了**深度学习**技术,通过对18,000个特征进行筛选,最终选择了4,500个最具代表性的质谱峰作为模型输入。这些特征经过**数据预处理**,包括强度数据的平方根变换、使用Savitzky-Golay滤波器进行平滑处理,以及通过**非线性迭代峰剪切算法**进行基线校正。这些步骤有助于提高数据的准确性和模型的稳定性。此外,为了进一步优化模型的性能,研究团队还采用了**分层抽样**的方法,确保训练集和验证集在ST37与非ST37菌株之间的分布均衡。

在模型训练阶段,研究团队采用**10折交叉验证**以增强模型的鲁棒性,并通过**外部验证**测试模型在不同数据集上的表现。外部验证的结果显示,模型在检测ST37菌株时具有良好的判别能力,其**敏感度**达到0.94,**特异度**为0.94,**准确率**为0.94,**F1分数**为0.91,这些指标均表明模型在实际应用中具有较高的可靠性。与传统的检测方法相比,基于ANN的模型能够更快地完成分类任务,同时减少了对额外试剂和设备的需求,使其在成本效益方面具有明显优势。

值得注意的是,虽然PCR技术在短时间内能够完成物种级别的检测,但其在高分辨率菌株分型方面的能力有限。相比之下,基于MALDI-TOF MS和ANN模型的方法不仅能够实现物种级别的识别,还能进一步完成菌株级别的分类,这为临床诊断提供了更高的精度。此外,该方法还能保留细菌样本,以便后续进行**抗菌药物敏感性测试**和**基因组分析**,这对于感染控制和耐药性研究具有重要意义。

尽管本研究在模型构建和性能评估方面取得了显著进展,但仍存在一些局限性。首先,所使用的菌株样本数量相对有限,且主要来自中国浙江省的多个医院,这可能影响模型的泛化能力。因此,未来的研究应扩大样本来源,涵盖更多地区和国家,以增强模型的适用性。其次,模型的构建基于单一的MALDI-TOF平台,这可能限制其在不同设备之间的可重复性。此外,虽然研究团队通过**Shap值**(可解释性AI技术)提高了模型的透明度,但ANN的“黑箱”特性仍然可能在某些临床环境中影响其解释性。最后,本研究主要基于回顾性数据,因此未来需要在实际临床环境中进行前瞻性验证,以确保模型的稳定性和实用性。

总体而言,本研究通过结合MALDI-TOF MS和机器学习技术,开发出了一种快速、准确且经济高效的检测方法,能够在10秒内完成对ST37菌株的初步筛查。这一方法不仅提升了检测效率,还为临床医生提供了更及时的诊断信息,有助于改善患者预后。同时,该方法在实际应用中具备良好的扩展性和适应性,能够为公共卫生部门提供有力的工具,以更好地监测和控制艰难梭菌感染的传播。未来,随着样本数据的进一步丰富和模型的持续优化,基于MALDI-TOF MS和ANN的检测方法有望在更多临床场景中得到广泛应用。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号