编辑推荐:
肝硬化是慢性肝病(CLD)患者的主要死因,现有预测方法存在不足。研究人员开展基于机器学习的血浆代谢组学对肝硬化风险分层的研究。结果显示该方法可显著提升预测性能,APRI + 代谢组学模型表现最佳,为早期筛查肝硬化风险提供了有力工具。
在全球范围内,肝硬化是一个严重威胁人类健康的疾病,它是慢性肝病(CLD)患者走向生命终点的重要 “杀手”,每年都有超过 100 万人因它失去生命。目前,肝硬化的研究主要集中在诊断方面,对于 CLD 患者肝硬化的风险分层研究较少。现有的预测肝硬化的风险评分常受研究的肝病类型或样本量限制,肝脏活检虽为诊断 “金标准”,但因其有创性,不适合长期监测,血清标志物如天冬氨酸转氨酶与血小板比值指数(APRI)和纤维化 - 4(FIB - 4)指数,在灵敏度和特异性上也不尽人意。在这样的背景下,研究人员急需寻找一种更可靠的方法来评估 CLD 患者肝硬化进展的风险。
浙江大学附属杭州市中医院和中山大学孙逸仙纪念医院的研究人员,利用英国生物银行(UKB)的资源,开展了一项旨在通过整合代谢组学数据与机器学习技术,增强对 CLD 患者肝硬化风险分层能力的研究。该研究成果发表在《BMC Gastroenterology》上,为肝硬化风险评估带来了新的曙光。
研究人员用到的主要关键技术方法如下:首先,从 UKB 中获取 118,019 例基线 EDTA 非空腹静脉血清样本的代谢生物标志物,利用高通量核磁共振(NMR)代谢组学平台进行检测,最终选取 168 种原发性代谢物用于分析。之后,将数据分为推导队列(80%)和验证队列(20%)。通过 Cox 比例风险(Cox - PH)模型评估单个代谢物与肝硬化的关联,并采用弹性网络(EN)正则化的 Cox - PH 模型开发预测模型,用 Harrell’s C 指数等指标评估模型性能。
研究结果如下:
- 基线特征:经过严格筛选,2738 例 CLD 患者纳入研究,中位年龄 56 岁,51.4% 为男性。在研究期间,发展为肝硬化的患者(5.2%)年龄更大,社会经济地位(如 Townsend 剥夺指数 TDI)、饮酒频率等因素与肝硬化的发生显著相关,临床化学指标及常用评分(APRI、FIB - 4)也与肝硬化密切相关。
- 个体代谢物与肝硬化的关系:经 Cox 比例风险模型分析,调整年龄和性别后,168 种代谢物中有 68 种与肝硬化事件显著相关;进一步调整所有特征后,仍有 21 种显著相关,其中 10 种在两个模型中均显著,主要涉及脂蛋白颗粒、磷脂、总脂质等类别。
- 血清代谢组学在肝硬化风险分层中的应用:构建了 5 种模型,包括代谢组学模型、FIB - 4 模型、APRI 模型、FIB - 4 + 代谢组学模型和 APRI + 代谢组学模型。通过受试者工作特征曲线(ROC)、决策曲线分析(DCA)等评估发现,APRI + 代谢组学模型的 AUC 最高(0.747),在几乎所有阈值下净临床获益最高,表明其在肝硬化风险分层中性能最优。
- 代谢组学与肝硬化风险分层:纳入血清代谢组学的 FIB - 4 和 APRI 模型改善了肝硬化风险分层,除代谢组学模型外,其他模型校准良好,包含代谢组学的模型在生存分层方面表现更优。
- 模型选择和特征保留:采用 EN - 正则化的 Cox 回归模型进行特征选择,最终保留 17 种代谢物,网络可视化显示单个代谢物能有效代表高度相关的代谢物簇。
- 关键代谢物鉴定和通路富集分析:APRI + 代谢组学模型确定了 21 种关键代谢物,涉及氨基酸、脂肪酸、胆固醇和脂蛋白等多个功能类别。通路富集分析发现,苯丙氨酸和酪氨酸代谢、卟啉代谢、氮代谢等多条通路在肝硬化进展中被破坏。
研究结论表明,1H-NMR 血清代谢组学可有效作为评估肝硬化风险的独立筛查工具,机器学习能在保持预测性能的同时减少特征数量,APRI + 代谢组学模型在肝硬化风险分层中表现卓越。不过,研究也存在一定局限性,如 UKB 数据存在 “健康志愿者” 偏倚、缺乏肝脏弹性成像数据、样本为非空腹状态等。但总体而言,该研究为肝硬化风险评估提供了新的方向和有力的工具,有望推动肝硬化早期筛查和干预的发展,对降低肝硬化相关死亡率具有重要意义。