代谢组学与机器学习的结合提升了系统性自身免疫性疾病的诊断水平及患者分型能力
《Computers in Biology and Medicine》:Metabolomic and machine learning enhances patient diagnosis and stratification in systemic autoimmune diseases
【字体:
大
中
小
】
时间:2025年11月25日
来源:Computers in Biology and Medicine 6.3
编辑推荐:
本研究通过代谢组学与机器学习技术,分析了716例系统性自身免疫病(SADs)患者的血清代谢特征,发现疾病特异性与共享代谢标志物,构建了高准确率(AUC 0.79-0.87)的分类模型,并揭示了代谢亚群与临床特征的相关性。研究证实HDL代谢异常、炎症标志物GlycA及抗氧化代谢物下降是共同特征,而特定脂质、氨基酸代谢紊乱则体现疾病特异性,为精准医学提供新思路。
本文探讨了系统性自身免疫疾病(SADs)的代谢组学特征,并利用机器学习(ML)技术对这些疾病的诊断与患者分层进行了深入分析。系统性自身免疫疾病是一类具有高度异质性的疾病,它们的临床表现、病理机制以及治疗反应存在显著差异,这使得传统的诊断方法在区分不同疾病时面临挑战。研究团队通过分析716名受试者的血清代谢组数据,揭示了这些疾病在代谢层面的共同特征与独特变化,为精准医学的发展提供了新的视角。
### 研究背景与意义
系统性自身免疫疾病包括类风湿关节炎(RA)、系统性红斑狼疮(SLE)、系统性硬化症(SSc)和抗磷脂综合征(APS)等,这些疾病不仅严重影响患者的生活质量,还显著增加了死亡风险。全球范围内,这些疾病的发生率持续上升,给医疗系统带来了沉重负担。由于这些疾病在临床表现上存在高度重叠,诊断往往延迟,同时缺乏特异性生物标志物,使得患者的分层管理变得困难。此外,尽管已有研究揭示了多种分子通路的异常,但这些疾病的发展机制仍未完全明确。
因此,研究者希望通过整合代谢组学与机器学习方法,揭示SADs的分子特征,发现新的生物标志物,并提升疾病的诊断准确性和患者分层的精确度。代谢组学作为研究生物体内所有代谢物的科学手段,能够提供关于生物化学状态的功能性信息,而机器学习则能从大规模数据中提取复杂的模式,从而支持更精准的疾病分类和个体化治疗策略。
### 方法概述
本研究基于国际多中心研究项目PRECISESADS,纳入了来自不同国家的716名受试者,其中包括148名APS患者、272名RA患者、183名SLE患者、70名SSc患者以及43名健康对照者(HDs)。研究采用了核磁共振(NMR)光谱技术对血清代谢组进行分析,这是一种能够精确测量数百种生物标志物的方法,涵盖了脂质、氨基酸、脂肪酸、载脂蛋白、脂蛋白颗粒、炎症标志物以及糖酵解相关代谢物等。
在分析过程中,研究者首先通过统计学方法(如t检验和曼-惠特尼U检验)识别了各疾病组与健康对照组之间显著差异的代谢物。随后,应用了监督式和非监督式机器学习算法,以构建疾病特异性代谢特征,并探索不同疾病之间的代谢异质性。监督式机器学习模型用于疾病诊断,而非监督式模型则用于识别潜在的代谢亚群,从而揭示疾病分类之外的生物学特征。
### 代谢组学特征分析
研究结果显示,每种系统性自身免疫疾病在代谢层面均表现出独特的改变。其中,SSc显示出最多的代谢物变化(99种),其次是APS(68种),而SLE和RA的变化相对较少(30种和17种)。这些代谢物的改变涉及多个生物学过程,包括脂质代谢、氨基酸代谢、能量代谢以及炎症相关通路。
例如,在APS患者中,HDL相关的脂质显著减少,而VLDL相关的脂质则有所增加。这种变化可能与血管功能障碍和促凝血状态有关。而在SLE患者中,HDL相关脂质和某些必需氨基酸(如亮氨酸、异亮氨酸和组氨酸)的水平显著下降,同时GlycA这一促炎标志物的表达增加。这种代谢特征与SLE的慢性炎症和免疫系统异常密切相关。
RA患者则表现出HDL相关脂质和组氨酸的显著降低,同时GlycA和某些能量代谢相关代谢物(如柠檬酸、乳酸和苯丙氨酸)的水平上升。这种代谢模式反映了RA中增强的能量消耗和炎症活动。对于SSc患者,HDL相关脂质的减少和VLDL相关脂质的增加尤为显著,而组氨酸的水平下降也表明其在疾病中的重要性。
尽管这些疾病在代谢层面存在共性,如抗氧化和抗炎代谢物的减少以及促炎标志物GlycA的增加,但每种疾病仍具有独特的代谢特征。这些特征可能反映了疾病特异性病理机制,如脂质重塑、能量代谢改变或免疫反应的特定模式。
### 机器学习在疾病诊断中的应用
研究者开发了多种机器学习模型,以评估代谢组学标志物在不同SADs中的诊断潜力。监督式机器学习模型采用了一对一(one-vs-rest)策略,将目标疾病患者与非目标疾病患者及健康对照组进行比较。模型的构建基于标准化的预处理流程,包括数据清洗、特征选择和正则化逻辑回归等方法。最终,模型在诊断性能上表现出色,AUC值在0.79至0.87之间,表明其具有较高的预测准确性。
在模型构建过程中,研究者采用了交叉验证和独立测试集,以确保模型的稳定性和泛化能力。此外,通过排列重要性(Permutation Importance)分析,进一步评估了各代谢物对模型预测的贡献。结果显示,某些代谢物(如组氨酸和GlycA)在多个疾病中均表现出显著的诊断价值。
非监督式机器学习方法则用于探索SADs的潜在代谢亚群。研究者使用K均值聚类算法对代谢组数据进行分析,发现患者可以被划分为三个主要代谢亚群。这些亚群的分布与临床诊断之间没有直接对应关系,表明代谢特征可能超越传统疾病分类,揭示更深层次的生物学异质性。例如,SSc患者主要分布在第三代谢亚群,而RA患者则更多出现在第二亚群。
### 代谢亚群与临床特征的关联
进一步分析表明,代谢亚群与多种临床特征密切相关。例如,在APS中,第一代谢亚群与较高的aGAPSS评分、高血压、血脂异常和动脉血栓形成有关。这表明第一亚群可能代表了一种与心血管风险增加相关的代谢状态。在SLE中,第一亚群表现出较高的肥胖率、高血压和动脉粥样硬化斑块的发病率,而第三亚群则与肾病和抗dsDNA抗体阳性相关。RA患者的代谢亚群则与动脉粥样硬化斑块、高动脉粥样硬化指数和高血压显著相关,而SSc患者的代谢亚群则与肺纤维化、抗CENP-B抗体阳性以及弥漫性皮肤型SSc(dcSSc)有关。
这些结果强调了代谢组学在患者分层中的重要性,因为它能够揭示疾病相关的临床特征,从而支持更精准的诊断和治疗策略。同时,代谢亚群的识别也为未来研究提供了方向,例如探索不同代谢状态对疾病进展的影响,以及开发针对特定代谢亚群的干预措施。
### 代谢组学与免疫系统的关系
研究还指出,代谢组学的变化可能与免疫系统的激活密切相关。例如,HDL相关脂质的减少可能削弱了其在抗炎和保护心血管方面的功能,从而加剧了SADs相关的系统性并发症。此外,某些代谢物(如组氨酸)的减少可能反映了慢性炎症状态下免疫细胞的代谢需求增加,而GlycA的升高则与炎症程度和疾病负担相关。
值得注意的是,许多代谢通路与肠道微生物群的代谢活动密切相关。例如,短链脂肪酸、胆汁酸和氨基酸衍生物等微生物相关代谢物可能通过调节宿主免疫反应影响疾病进程。尽管本研究使用的是基于NMR的代谢组学方法,未能直接检测到微生物相关代谢物,但其发现的代谢组变化可能间接反映了微生物群与宿主之间的相互作用。因此,未来研究可以进一步整合代谢组学与微生物组学数据,以更全面地理解系统性自身免疫疾病的发病机制。
### 治疗对代谢组的影响
研究还探讨了治疗对代谢组变化的潜在影响。由于所有患者均在接受治疗,因此难以完全排除药物对代谢组的干扰。然而,初步分析表明,糖皮质激素的使用并未显著改变代谢组的总体特征,仅在少数代谢物上产生了轻微影响。此外,各代谢亚群在治疗分布上表现出相似性,表明代谢组的变化更多由疾病本身的生物学特性驱动,而非治疗干预。
这一发现对于临床实践具有重要意义,因为它表明代谢组学可以作为疾病诊断和分层的独立指标,不受治疗方案的影响。然而,研究者也指出,由于所有患者均处于治疗状态,因此无法完全排除药物对代谢组的潜在影响,这为未来研究提出了新的挑战。
### 研究局限与未来方向
尽管本研究具有重要的科学价值,但也存在一些局限性。首先,其横断面设计使得无法评估代谢组变化与疾病进展之间的动态关系。未来研究可以考虑纵向采样,以探索代谢组变化是否发生在临床症状之前,或者是否能够预测治疗反应。其次,尽管监督式机器学习模型表现出较高的诊断准确性,但其在独立队列中的验证仍需进一步研究,以确保其在临床中的适用性。此外,代谢亚群的生物学机制仍需深入探索,以确定其对疾病预后和治疗选择的具体影响。
最后,基于NMR的代谢组学方法虽然具有高精度和可重复性,但其代谢物覆盖范围有限,尤其在肠道微生物相关代谢物和低丰度炎症介质方面存在不足。因此,未来研究可以结合其他分析技术,如质谱(MS)或微生物组学分析,以获得更全面的代谢信息,并更深入地理解宿主与微生物之间的代谢互动。
### 结论
综上所述,本研究通过整合代谢组学与机器学习方法,揭示了系统性自身免疫疾病的代谢特征,并发现了一些具有诊断和预后价值的代谢物,如组氨酸、GlycA和白蛋白。这些代谢物的变化不仅反映了疾病的共性,还揭示了各疾病独特的病理机制。此外,研究还识别了三种代谢亚群,这些亚群与特定的临床特征相关,为精准医学提供了新的思路。
通过这些发现,研究者希望推动代谢组学在系统性自身免疫疾病中的应用,从而实现更早的诊断、更精准的患者分层以及更个性化的治疗策略。未来的研究可以进一步探索这些代谢物与疾病进展、治疗反应之间的关系,并结合其他生物标志物,以构建更全面的疾病诊断和分层模型。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号