血浆蛋白质组学机器学习模型预测乙型肝炎病毒相关肝衰竭患者继发感染风险

《Nature Communications》:Proteomics-based machine learning model for predicting secondary infection in HBV-related liver failure

【字体: 时间:2026年03月04日 来源:Nature Communications 15.7

编辑推荐:

  为精准预测乙型肝炎病毒相关肝衰竭(HBV-LF)患者继发感染风险并提供早期干预依据,研究人员开展了基于血浆蛋白质组学的机器学习模型研究。该模型整合了溶菌酶(LYZ)、钙调蛋白1(CALM1)等关键蛋白及临床指标,在发现队列和验证队列中均表现出优异的预测能力(AUROC分别达0.980和0.873),显著优于传统炎症指标,并更能预测28天死亡率,为临床高危患者识别提供了新工具。

  
肝脏是人体的“化工厂”,一旦发生严重衰竭,生命将岌岌可危。乙型肝炎病毒(Hepatitis B Virus, HBV)是导致这种灾难性后果——肝衰竭(Liver Failure, LF)的主要原因之一。更雪上加霜的是,这些脆弱的患者极易遭受细菌、真菌等病原体的二次打击,即继发感染(Secondary Infection, SI)。继发感染不仅是加重器官损伤、加速病情恶化的“催化剂”,更是导致患者死亡的重要推手。然而,临床上缺乏能够在感染发生前就精准识别高危患者的“预警系统”。传统的炎症标志物,如C反应蛋白(CRP)、白细胞计数(WBC)等,在肝衰竭患者中常因肝脏本身功能紊乱而失去特异性,预警能力有限。因此,能否从分子层面找到更早、更特异的预警信号,从而为医生争取宝贵的治疗时间窗,成为亟待解决的临床难题。
近期发表于《Nature Communications》的一项研究,为破解这一难题带来了突破性进展。研究团队将目光投向了血液中蕴藏信息最为丰富的分子群体——蛋白质。他们提出,能否通过系统分析HBV相关肝衰竭患者的血浆蛋白质组(Proteomics)变化,构建一个能够早期预测继发感染风险的机器学习模型?这个模型能否比现有指标更准确地预测患者的死亡风险?为了回答这些问题,研究人员开展了一项系统而严谨的多中心临床研究。
本研究整合了多项关键技术。首先,通过前瞻性多中心临床研究,共纳入了114名患者的发现队列和两个各60名患者的独立验证队列。在发现阶段,运用非靶向蛋白质组学(Untargeted proteomics)技术对患者血浆进行全景式扫描,筛选与继发感染相关的差异蛋白。随后,采用最小冗余最大相关(Minimum Redundancy Maximum Relevance, mRMR)算法进行特征筛选,并结合逻辑回归(Logistic Regression)建模,构建了核心预测模型。在验证阶段,则采用了靶向蛋白质组学(Targeted proteomics)和酶联免疫吸附试验(ELISA)对模型中的关键蛋白标志物进行定量验证,并评估了基于ELISA的简化模型的预测效能。
研究结果
1. 继发感染患者存在显著的炎症与凝血通路紊乱
通过对发现队列患者的血浆进行非靶向蛋白质组学分析,研究人员发现,发生继发感染的患者与未感染患者相比,其血浆蛋白质谱存在显著差异。进一步的生物信息学分析(如通路富集分析)揭示,这些差异蛋白主要富集在炎症反应和凝血相关信号通路上。这表明,在继发感染的临床事件发生之前,患者体内已经出现了系统性的免疫和凝血功能失调,为利用蛋白质标志物进行早期预警提供了生物学基础。
2. 构建并验证了一个高性能的六指标预测模型
研究团队从蛋白质组学数据中筛选出最具预测价值的特征,结合关键的临床实验室指标,最终构建了一个包含六个变量的机器学习模型。这六个变量分别是:两个临床生化指标——总胆红素(Total Bilirubin)和天冬氨酸氨基转移酶(AST);以及四个血浆蛋白标志物——溶菌酶(Lysozyme, LYZ)、钙调蛋白1(Calmodulin 1, CALM1)、丝氨酸蛋白酶抑制剂D族成员1(Serpin Family D Member 1, SERPIND1)和皮肤桥蛋白(Dermatopontin, DPT)。
该模型在内部训练(发现)队列中表现出了卓越的区分能力,其受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUROC)高达0.980。更重要的是,在两个独立的外部验证队列中,模型的AUROC分别达到0.873,显示出良好的泛化性能。相比之下,临床常用的感染指标,如CRP、WBC和中性粒细胞百分比(NE%),其预测能力(AUROC约0.5-0.7)远逊于这个新模型。
3. 模型在预测28天死亡率方面优于现有评分系统
除了预测感染,该研究的另一个重要发现是,这个基于蛋白质组学的风险评分,在预测患者入组后28天内的死亡风险时,也显著优于目前肝衰竭领域公认的两个权威预后评分:慢性肝衰竭-联盟慢加急性肝衰竭评分(Chronic Liver Failure–Consortium Acute-on-Chronic Liver Failure score, CLIF-C ACLF)和终末期肝病模型(Model for End-Stage Liver Disease, MELD)。这表明该模型捕捉到的病理生理紊乱,与患者的短期预后密切相关,具有双重预测价值。
4. 基于临床常用技术(ELISA)的简化模型验证了可行性
为了推动该模型的临床转化应用,研究团队进一步采用临床上更普及、成本更低的酶联免疫吸附试验(ELISA)对验证队列2中的患者血浆进行检测,定量上述关键蛋白标志物。结果显示,ELISA测得的蛋白水平变化趋势与蛋白质组学数据高度一致。基于ELISA数据重建的简化模型,其预测效能(AUROC为0.883)与基于复杂质谱技术的原始模型相当。这有力地证明了,该模型的核心生物标志物 panel 有可能通过现有常规检测平台实现,大大增强了其临床应用的现实可行性。
结论与讨论
这项研究成功地开发并验证了一个基于血浆蛋白质组学和机器学习的预测模型,用于早期识别HBV相关肝衰竭患者发生继发感染的高风险。该模型仅需六个指标(LYZ, CALM1, SERPIND1, DPT, 总胆红素和AST),即可实现高精度的风险分层,其预测效能稳定且显著超越现有临床指标。研究不仅揭示了继发感染前期伴随的炎症与凝血通路深度失调的分子特征,还发现该模型评分是预测患者28天死亡率的强有力指标,价值优于CLIF-C ACLF和MELD评分。尤为重要的是,通过ELISA技术的验证,确立了该模型向临床常规检测转化的技术路径。
这项工作的意义重大。它为肝衰竭这一危重病患者群体提供了一个全新的、高效的“早期预警系统”,使得临床医生有可能在感染发生前就干预高危患者,例如加强监测、经验性预防或调整免疫支持策略,从而有望降低感染发生率、改善患者预后。该研究也展示了多组学数据与机器学习算法相结合,在解决复杂临床预后预测问题中的巨大潜力,为其他重症疾病的精准风险管理提供了可借鉴的研究范式。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号