编辑推荐:
本推荐聚焦肠炎沙门氏菌(Salmonella enterica)快速分型难题,介绍 FT-IR 光谱结合机器学习的新方法。通过分级分类策略,显著提升血清型鉴别准确性,尤其对复杂血清群效果显著,为公共卫生监测和食品安全提供高效工具。
研究背景与目的
肠炎沙门氏菌(Salmonella enterica)是全球食源性疾病的主要病原体之一,2019 年导致超 42 万例死亡。传统血清分型(如 White-Kauffmann-Le Minor 方案)依赖抗原凝集反应,需 150 种以上抗血清和专业人员,耗时数天且成本高。分子方法(如全基因组测序 WGS)虽准确但设备和分析成本高,尤其在中低收入国家难以普及。傅里叶变换红外光谱(FT-IR)技术通过检测细菌化学组成的特征光谱实现快速分型,结合机器学习算法有望成为高效替代方案。本研究旨在评估 IR Biotyper 系统对肠炎沙门氏菌血清型的鉴别能力,探索分级分类策略对复杂血清群的分型效果。
材料与方法
菌株与样本
研究收集 458 株肠炎沙门氏菌分离株,涵盖 9 种血清型:Infantis、Enteritidis、Typhimurium、I,4,[5],12:i:-、Montevideo、Agona、Thompson、Panama 和 Abony,来源包括环境水、禽肉、临床样本等。所有菌株经传统微生物培养、分子鉴定(如 PCR)和 WGS 验证血清型。
光谱采集与分析
菌株在胰蛋白酶大豆琼脂(TSA)培养基培养后,制备菌悬液并点样于 IR Biotyper 硅靶板,干燥后在 3,996–500 cm-1光谱范围内采集红外光谱。每个菌株至少获取 3 次生物学重复光谱,共获得 5,428 条光谱用于模型训练和验证。
机器学习模型构建
采用两步分级分类策略:首先通过 IR Biotyper 内置的 “Salmonella 血清群” 分类器鉴别 O 抗原血清群(O:4、O:7、O:9),然后针对各血清群内的血清型,使用支持向量机(SVM)算法构建分类模型。通过线性判别分析(LDA)优化主成分(PC)和惩罚参数(C 值),评估模型的灵敏度、特异性、阳性预测值(PPV)和阴性预测值(NPV)。
结果
血清群鉴别验证
O 抗原分类器对 5,428 条光谱的鉴别准确率达 100%,成功将菌株分为 O:4(Typhimurium、Agona、Abony 等)、O:7(Infantis、Montevideo 等)和 O:9(Enteritidis、Panama)三个血清群,表明 FT-IR 光谱在血清群水平具有强鉴别力。
血清型分类性能
- O:4 血清群:Abony 血清型分类器性能最佳(灵敏度 / 特异性 = 100%),Agona 次之(99% 灵敏度),而 Typhimurium/I,4,[5],12:i:- 混合组灵敏度为 93%。LDA 显示 Agona 光谱聚类最紧凑,但 Abony 因无错分表现更优。
- O:7 血清群:Infantis 分类器灵敏度 100%,Thompson 为 98%,但 Montevideo 仅 67%,可能与该血清型样本量少(15 株)有关。
- O:9 血清群:Enteritidis 分类器灵敏度 100%,Panama 为 80%,后者因训练样本较少导致性能受限。
分级分类的优势
通过先鉴别血清群再细分血清型的策略,显著降低了同群血清型的误判率。例如,O:4 血清群内的光谱变异通过血清群特异性特征筛选后,分类准确率从初始的 85% 提升至 97%,表明分级策略有效利用了血清群间的光谱差异,减少了跨群干扰。
讨论与结论
FT-IR 光谱结合分级分类策略在肠炎沙门氏菌血清型鉴别中表现出高潜力,尤其对 Abony、Infantis、Enteritidis 等血清型实现近 100% 准确分型。尽管部分血清型(如 Montevideo、Panama)因样本量或光谱相似性导致性能不足,但通过优化训练集规模和数据预处理(如去除离群光谱)可进一步提升。与传统方法相比,IR Biotyper 系统具有高通量(单次可处理 96 样本)、低成本(约为 WGS 的 1/10)和快速(4 小时内出结果)的优势,适合临床、食品工业和公共卫生领域的实时监测。未来需扩大血清型覆盖范围,纳入更多新兴耐药菌株,以增强该技术的全球适用性。研究证实,FT-IR 分级分类法为沙门氏菌分型提供了稳健、可扩展的新框架,有望推动病原检测技术的革新。