基于机器学习的脓毒症瘦素相关生物标志物鉴定与预后预测模型研究

【字体: 时间:2025年09月30日 来源:Frontiers in Cellular and Infection Microbiology 4.8

编辑推荐:

  本研究通过整合非负矩阵分解(NMF)、加权基因共表达网络分析(WGCNA)及多算法机器学习模型,首次系统构建了脓毒症瘦素相关分子分型体系及高精度预后预测工具。研究鉴定出TFRC与PILRA为核心生物标志物,经单细胞测序与实验验证证实其免疫调控功能,为脓毒症个体化诊疗提供新靶点。

  
背景:瘦素(Leptin)在脓毒症预后中扮演重要角色,但其机制尚不明确。本研究旨在通过机器学习方法构建瘦素相关的诊断与预后模型,并鉴定潜在生物标志物。
方法:研究采用非负矩阵分解(NMF)识别瘦素相关脓毒症分子亚型,通过加权基因共表达网络分析(WGCNA)确定相关基因模块与枢纽基因。将脓毒症患者与对照组的差异表达基因(DEGs)与WGCNA结果取交集,筛选关键基因。基于这些分析,使用最小绝对收缩与选择算子(Lasso)和随机森林(Random Forest, RF)算法构建28天死亡率预后分类模型,同时采用随机生存森林(Random Survival Forest, RSF)和梯度提升机(Gradient Boosting Machine, GBM)构建时间-事件预后模型。通过单细胞RNA测序(scRNA-seq)评估核心基因在免疫细胞类型中的表达模式,并采用实时定量PCR(qPCR)和蛋白质印迹(Western blot)进行表达验证。
结果:研究鉴定出三种具有不同预后的瘦素相关脓毒症亚型。WGCNA分析中的粉红色(pink)和鲑鱼色(salmon)模块与脓毒症显著相关。从DEGs与WGCNA的交集中筛选出70个核心基因。预后分类模型和时间-事件预后模型在训练集和外部验证队列中均表现出强劲预测性能。通过机器学习、单细胞数据和实验验证,TFRC(转铁蛋白受体)和PILRA(配对免疫球蛋白样2型受体α)被一致确定为潜在生物标志物。
NMF聚类揭示脓毒症患者的免疫浸润与临床特征:基于GeneCards数据库的瘦素相关基因,对GSE65682数据集进行NMF分析,共识矩阵将样本分为三个明显簇群(Cluster 1-3)。NMF秩调查显示三簇结构具有最佳拟合度。主成分分析(PCA)证实簇间分离良好。预后分析表明Cluster 1预后最佳,Cluster 3最差。除γδ T细胞外,三簇间免疫细胞浸润存在显著差异。临床特征分析显示年龄、性别、血小板减少症、ICU获得性感染和糖尿病分布无显著簇间差异。
WGCNA分析:采用软阈值功率β=9构建基因共表达网络,生成拓扑重叠矩阵(TOM)并检测模块,最终得到7个基因模块。其中粉红模块与鲑鱼模块显示显著相关性,模块成员(MM)与基因显著性(GS)密切相关。
功能富集分析:粉红模块基因主要参与免疫相关过程,如白细胞迁移、趋化作用和吞噬作用,涉及分泌颗粒膜和黏着斑等组分,功能包括GTP酶调控和激酶活性,KEGG通路富集于吞噬体、趋化因子信号通路和免疫细胞迁移。鲑鱼模块基因则与细胞周期过程相关,如染色体分离和核分裂,富集于囊泡腔和溶酶体组分,功能涉及DNA解旋酶活性和微管结合,KEGG通路包括DNA复制、细胞周期和错配修复。
枢纽基因鉴定与功能分析:通过ComBat算法校正批次效应后,PCA显示数据集整合良好。鉴定出745个DEGs,与WGCNA模块基因取交集后获得70个枢纽基因。染色体定位显示这些基因分布于除4、12、18和Y染色体外的所有染色体。功能富集分析表明枢纽基因主要参与细菌防御、细胞间黏附和革兰氏阴性菌反应等免疫相关生物过程,定位於分泌颗粒腔,参与激酶调控和脂多糖结合,KEGG通路富集于轴突导向、溶酶体、efferocytosis和叶酸生物合成。
机器学习构建脓毒症28天死亡率预后分类模型:采用多种机器学习算法组合(共113种模型),以GSE65682为训练集,E-MTAB-4451、E-MTAB-5273、E-MTAB-7581和GSE63042为外部验证集。Lasso结合随机森林(RF)算法表现最佳(平均AUC最高),被选为最终预测模型。训练集AUC达0.94,外部验证集AUC介于0.74-0.83之间。混淆矩阵显示分类准确性均衡,决策曲线分析(DCA)表明模型具有广泛阈值概率下的临床效用。ROC曲线分析显示该模型预测性能优于传统临床变量。
脓毒症时间-事件预后模型的开发与评估:采用98种机器学习算法或组合,以GSE65682为训练集,GSE54514和GSE95233为外部验证集。RSF与GBM组合获得最高平均C-index,被用于构建最终预后模型。高风险组患者生存结局显著较差(除GSE54514数据集外)。时间依赖性ROC曲线显示风险评分在不同时间点均保持高预后准确性。与已发表模型相比,该模型在GSE65682数据集中表现最优,在其他队列中始终位居前列。C-index在7、14和28天均优于传统临床变量。单变量和多变量Cox回归分析确认风险评分是脓毒症结局的独立预后因素。诊断模型与预后模型共享TFRC、PILRA、DEFA4、KRT23和BEX1五个特征。
单细胞转录组分析揭示脓毒症的细胞异质性与基因表达特征:经过严格质控过滤后,采用Harmony算法校正样本间变异,改善跨条件细胞整合。基于Harmony校正的主成分(PC13)进行聚类,鉴定出23个转录 distinct 簇,通过SingleR包注释为六大免疫细胞类型:单核细胞(Monocyte)、NK细胞(NK_cell)、中性粒细胞(Neutrophils)、血小板(Platelets)、红细胞系祖细胞(Erythroblast)和B细胞(B_cell)。单核细胞进一步分为经典、中间和非经典亚群。最终 delineate 八种免疫细胞群体。在五个候选基因中,TFRC和PILRA在单核细胞亚群中表达显著高于其他免疫细胞类型,而DEFA4、KRT23和BEX1表达极低或可忽略。特征图确认其细胞类型特异性表达模式。TFRC和PILRA在脓毒症组与对照组间差异表达,且在脓毒症组内八种免疫细胞类型间表达存在显著差异,其余基因无此变化。
TFRC与PILRA在健康对照和脓毒症患者中的表达谱:在健康对照、脓毒症存活者和非存活者的PBMCs中验证,TFRC表达逐步升高,PILRA逐步降低(qPCR和WB结果一致)。GSE154401数据集分析显示瘦素抗体处理T细胞显著升高TFRC,PILRA呈非显著降低。GSE57065和GSE131761数据集中,脓毒症组TFRC上调、PILRA下调。
讨论:本研究通过整合WGCNA、差异表达分析和NMF,识别出瘦素相关基因,并据此开发了预测患者生存结局的预后模型和专门预测28天死亡率的诊断模型。两个模型在内部和外部验证队列中均表现良好。TFRC和PILRA作为两模型共享基因,经单细胞RNA测序显示其在特定免疫细胞群体中的独特表达谱。患者来源外周血样本验证证实它们在脓毒症个体与健康对照间显著差异表达,支持其作为脓毒症疾病分类和风险评估分子指标的潜力。
近年来众多机器学习脓毒症诊断模型在训练集表现优异但外部泛化性有限。本研究LASSO+RF诊断模型基于14个转录组特征,训练集AUC达0.999,四个独立验证队列AUC介于0.630-0.739之间。模型立足分子表达谱,兼具生物学可解释性和跨平台鲁棒性。预后模型方面,本研究整合12个基因,采用RSF+GBM集成学习策略更好捕捉非线性关系,在训练和外部数据集中均展现高预测性能。相较现有模型,本研究具有更广泛通路整合和更强大算法建模能力。
TFRC(转铁蛋白受体,CD71)是介导细胞铁摄取的跨膜糖蛋白,在增殖免疫细胞中广泛表达,通过结合转铁蛋白促进铁离子内化,支持淋巴细胞增殖与免疫功能。TFRC基因突变可导致联合免疫缺陷。PILRA是髓系细胞表达的抑制性受体,通过胞内ITIM结构域招募SHP-1等磷酸酶传递负向信号,下调单核/巨噬细胞和NK细胞活化,维持免疫稳态。动物模型中PILRA缺陷小鼠在炎症刺激后显示促炎细胞因子(如IL-1β、IL-6)产生增强,组织损伤加剧。
脓毒症免疫病理以免疫稳态破坏为特征。TFRC和PILRA表达改变可能参与这一失调。蛋白质组学分析显示脓毒症患者外周血TFRC水平显著高于健康对照,非存活者中更高,表明其与不良预后强相关。机制研究表明TFRC可能通过调控铁死亡(ferroptosis)影响疾病进展。PILRA在脓毒症中研究较少,但转录组聚类分析识别其作为脓毒症免疫亚型标志物,提示其表达可能调节炎症反应强度与轨迹。TFRC和PILRA可能介导 distinct 但互补的免疫代谢过程——铁调控与先天免疫调节,共同贡献于脓毒症发病机制。
本研究单细胞RNA测序数据与独立收集样本一致显示PBMCs中TFRC上调、PILRA下调。TFRC升高可能反映免疫细胞增殖增强,与疾病严重程度相关;PILRA降低提示抑制性信号减弱和潜在过度炎症状态。两者作为免疫调节靶点具有潜力。限制TFRC介导铁摄取的策略(如铁螯合或铁死亡抑制)可能减轻脓毒症炎症和组织损伤;调节PILRA信号可能双向调控早期过度炎症或晚期免疫抑制。
研究存在若干局限性:模型源自公开转录组数据集,缺乏前瞻性独立队列,可能限制临床普适性;外部验证数据集多缺乏详细临床注释,阻碍与SOFA评分或乳酸等常规变量整合;实验验证仅限于小样本PBMCs,虽在两个独立数据集(GSE57065和GSE131761)中模式一致,但未进行功能扰动实验;单细胞分析分辨率有限且缺乏空间背景;诊断与预后模型预测性能在不同数据集间存在变异,可能反映批次效应、人口差异或技术不一致。未来工作应聚焦前瞻性多中心验证、多组学与标准化临床数据整合及机制研究。
结论:机器学习方法识别出瘦素相关分子亚型,促进了脓毒症预后模型的开发。TFRC和PILRA被强调为潜在生物标志物,并获得多层级验证支持。这些发现凸显瘦素相关通路作为脓毒症免疫失调重要相关因素的潜力,但需进一步机制研究确认因果关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号