基于机器学习与蛋白质组学识别革兰氏阴性/阳性感染的血浆蛋白标志物研究

《BMC Infectious Diseases》:Identification of protein biomarkers to differentiate between gram-negative and gram-positive infections in adults suspected of sepsis

【字体: 时间:2025年11月16日 来源:BMC Infectious Diseases 3

编辑推荐:

  本研究针对脓毒症患者早期鉴别革兰氏阴性(G-)与革兰氏阳性(G+)细菌感染的临床难题,通过Olink邻近延伸检测技术(PEA)对285种血浆蛋白进行定量分析,结合LASSO等机器学习算法筛选出55种具有鉴别潜力的蛋白标志物。结果显示多标志物组合对G-/G+感染的区分效能有限(AUROC=0.58),未超越传统标志物性能。研究揭示了感染类型鉴别中蛋白质标志物的重叠性,为脓毒症精准诊断提供了多组学层面的技术验证与 cohort 研究范式。

  
当患者被推入急诊室,医生面临着一个生死时速的抉择:怀疑脓毒症(Sepsis)的患者需要在一小时内使用抗生素,但传统的血培养方法需要数天才能确定致病菌是革兰氏阴性(G-)还是革兰氏阳性(G+)细菌。错误的抗生素选择可能加剧耐药性甚至危及生命。尽管C反应蛋白(CRP)和降钙素原(PCT)等生物标志物已用于脓毒症诊断,但其敏感性和特异性有限(CRP灵敏度68-92%,特异性40-76%),且单一标志物难以应对脓毒症复杂的病理过程。因此,开发能够快速区分感染类型的多重蛋白标志物体系成为迫切需求。
在此背景下,Mahnaz Irani Shemirani等人在《BMC Infectious Diseases》发表研究,通过高精度蛋白质检测技术与机器学习算法,系统性探索了血浆蛋白在鉴别G-与G+感染中的价值。研究团队收集了瑞典Skaraborg医院2011-2012年间的社区获得性脓毒症患者血浆样本,包括154例G-感染(主要病原体:大肠杆菌56例、肺炎克雷伯菌20例)、92例G+感染(肺炎链球菌30例、金黄色葡萄球菌27例)及35例健康对照。
关键技术方法包括:使用Olink PEA技术(Cardio-metabolic、Cardiovascular II、Immune Response、Inflammation四组面板)定量285种血浆蛋白;采用GSimp算法处理低于检测限(LOD)的缺失值;通过LASSO(最小绝对收缩和选择算子)、随机森林(RF)和递归特征消除(RFE)三种机器学习算法筛选标志物;以逻辑回归(LR)和受试者工作特征曲线下面积(AUROC)评估分类性能。
优化蛋白标志物选择流程
研究通过系统比较不同缺失值处理策略发现,当蛋白缺失率阈值设定为<40%时(对应285个蛋白),模型判别效能最优。在此条件下,LASSO算法的分类准确率最高(71.2%),显著优于随机森林(63.0%)和递归特征消除-逻辑回归(RFE-LR,67.0%)。该结果验证了适度包容缺失值的数据策略在蛋白质组学分析中的有效性。
蛋白表达特征与样本分布模式
统计分析显示,G-与G+感染组间无单个蛋白表达存在显著差异(最小调整p值=0.29,CCL28蛋白)。而感染组与健康对照组间分别有284个(G-)和214个(G+)蛋白表达显著差异。主成分分析(PCA)与t分布随机邻域嵌入(tSNE)可视化显示,两类感染患者的样本分布高度重叠,印证了其分子特征的相似性。
鉴别性蛋白的筛选与验证
LASSO算法最终筛选出55个鉴别蛋白(33个正系数、22个负系数),其中炎症(Inf)和心血管II(CVD II)面板贡献最多蛋白。这些蛋白在区分感染组与健康对照组时表现卓越(AUROC=1.0),但在直接区分G-与G+感染时效能有限:G-感染鉴别AUROC=0.69,G+感染=0.66,而两者直接比较的AUROC仅为0.58。
鉴别蛋白的深度解析
对MFAP5(微纤维相关蛋白5)、TNF(肿瘤坏死因子)、TNFRSF13B(TNF受体超家族成员13B)等5个分布异常(偏度/峰度超常)蛋白的分析表明,其异常分布可能反映患者亚群异质性。剔除这些蛋白后模型效能略有下降(AUROC:G-=0.67,G+=0.62),说明蛋白组合的协同作用优于单个标志物。
研究结论指出,尽管通过高通量蛋白质组学与机器学习筛选出55个潜在鉴别蛋白,但其对G-/G+感染的区分能力未超越传统标志物。这一结果揭示了脓毒症宿主反应的高度重叠性,提示单一分子层面的区分存在固有局限。研究的创新性在于建立了从蛋白检测、数据清洗到机器学习筛选的全流程方法学框架,为后续大样本研究提供了技术范式。未来需要结合转录组、代谢组等多组学数据,并在更大队列中验证蛋白标志物的临床效用。
研究的局限性包括样本量较小、存在样本长期冻存可能引起的蛋白降解、以及队列中混合了符合/不符合Sepsis-3标准的患者。这些发现强调了脓毒症精准诊断的复杂性,也为下一代感染分型诊断技术的开发指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号