基于XGBoost与质谱联用技术筛选HBV相关肝病进展及肝癌治疗响应的代谢生物标志物研究
《Journal of Proteomics》:XGBoost- and Mass Spectrometry-Based Feature Selection for Identifying Metabolic Biomarkers Associated with HBV-Related Liver Disease Progression and Hepatocellular Carcinoma Treatment
【字体:
大
中
小
】
时间:2025年10月26日
来源:Journal of Proteomics 2.8
编辑推荐:
本研究针对慢性乙型肝炎(CHB)向肝硬化(LC)及肝细胞癌(HCC)进展过程中、以及HCC治疗(HCCAT)后代谢生物标志物不明的问题,研究人员开展了基于XGBoost机器学习与质谱技术的多组学分析。通过分析健康对照(HC)及不同病程患者的代谢谱,筛选出17个关键代谢标志物,其中9个为新发现,并构建了包含芥酸、二氢吗啡等物质的标志物组合,为HBV相关肝病的预后判断与疗效评估提供了新工具,凸显了代谢组学与人工智能结合的强大潜力。
肝脏疾病,尤其是由乙型肝炎病毒(HBV)感染所引发的一系列病症,是全球范围内重大的公共卫生挑战。这类疾病通常遵循一个典型的进展路径:从慢性乙型肝炎(CHB)开始,逐渐发展为肝纤维化和肝硬化(LC),最终可能恶化为肝细胞癌(HCC)——一种最常见的原发性肝癌。尽管医学界对HBV本身以及肝病进程已有相当了解,但在临床实践中,如何精准地预测慢性肝炎患者是否会向肝硬化和肝癌发展,以及如何有效评估肝癌患者的治疗反应,仍然是亟待解决的难题。传统的诊断方法,如影像学检查和甲胎蛋白(AFP)检测,其敏感性和特异性有时不尽如人意。因此,寻找能够更早、更准确地反映疾病状态和治疗效果的生物标志物,成为了当前研究的热点。
在这一背景下,代谢组学——这门系统研究生物体内所有小分子代谢物(代谢组)的科学——展现出巨大优势。因为代谢物是生命活动的最终产物,能够最直接、最动态地反映生物体的生理病理状态。理论上,通过分析血液或组织中的代谢物谱,可以捕捉到疾病发生发展的细微特征。然而,海量的代谢组学数据也带来了新的挑战:如何从成千上万的代谢物中筛选出真正有意义的标志物?这时,人工智能,特别是机器学习算法,提供了强大的解决方案。其中,XGBoost(极端梯度提升)算法因其在处理复杂分类问题上的高效性和准确性而备受青睐。
正是为了应对上述挑战,Shao-Hua Li(李绍华)等研究人员在《Journal of Proteomics》上发表了他们的研究成果。他们巧妙地将高效液相色谱-质谱联用(LC-MS/MS)代谢组学技术与XGBoost机器学习模型相结合,旨在系统地揭示与HBV相关肝病从CHB到LC,再到HCC,乃至HCC治疗后(HCCAT)这一完整进程相关的关键代谢变化,并筛选出具有预后和疗效评估潜力的新型代谢生物标志物。
本研究主要采用了以下关键技术方法:研究队列包含30名健康对照(HC)、29名慢性乙型肝炎(CHB)患者、30名肝硬化(LC)患者、30名肝细胞癌(HCC)患者和30名接受治疗的HCC患者(HCCAT),采集其血液样本;利用高效液相色谱-质谱联用(LC-MS/MS)技术进行非靶向代谢组学分析,获取全面的代谢物谱数据;运用XGBoost机器学习算法构建多分类模型,对不同的患者组别(如HC、CHB、LC、HCC、HCCAT)进行区分,并基于模型的重要性排序筛选关键代谢生物标志物;通过设计三种不同的比较分析策略(全病程比较、疾病进展比较、治疗反应比较)来系统评估代谢物的变化。
通过对HC、CHB、LC、HCC和HCCAT五组样本的代谢谱进行综合分析,研究人员发现,不同疾病阶段的代谢轮廓存在显著差异。XGBoost模型能够有效地将不同组别的样本区分开来,表明代谢组学数据蕴含着能够表征疾病进展的丰富信息。模型分析提示,从健康状态到CHB,再到LC和HCC,体内的能量代谢、氨基酸代谢、脂质代谢等通路发生了持续的、动态的紊乱。
2. XGBoost模型筛选出17个关键代谢生物标志物
通过XGBoost算法对代谢物的重要性进行排序,并结合三种不同的比较分析策略(全病程、疾病进展、治疗反应),研究团队最终鉴定出17个与HBV相关肝病密切相关的代谢生物标志物。尤为重要的是,在这17个标志物中,有9个是首次被报道与HBV相关的肝病进程有关,这为理解该疾病的分子机制提供了全新的视角和潜在的靶点。
在筛选出的标志物基础上,研究人员进一步聚焦,提出了一个由六种代谢物组成的核心生物标志物组合,包括芥酸(eicosenoic acid)、二氢吗啡(dihydromorphine)、半胱氨酸(cysteine)、乙酸(acetic acid)、谷甾醇(sitosterol)和次黄嘌呤(hypoxanthine)。这个组合在区分不同疾病阶段以及评估HCC治疗反应方面显示出良好的潜力。例如,次黄嘌呤作为嘌呤代谢的关键产物,其水平变化可能与细胞的增殖和能量状态有关;而某些脂质分子(如芥酸)的异常则可能反映了肝癌细胞膜组成的改变。
本研究的结论是,通过整合代谢组学和高性能的XGBoost机器学习算法,成功识别出了一组与HBV相关肝病进展和治疗反应相关的新型代谢生物标志物。这不仅证实了代谢紊乱在肝病发生发展中的核心作用,更重要的是,发现了一批此前未被认识的、与疾病相关的代谢物。
这项研究的意义重大。首先,在科学认知层面,它深化了我们对HBV相关肝病,特别是其向肝癌转化过程中的代谢重编程的理解,揭示了新的分子事件。其次,在临床转化层面,研究所筛选出的代谢生物标志物组合,特别是那个六分子的核心组合,为开发无创、高灵敏度的液体活检工具奠定了基础。未来,通过检测血液中这些代谢物的水平,有望实现对高危人群(如CHB患者)向HCC进展风险的早期预警,以及对HCC患者治疗效果的快速、客观评估,从而指导个体化治疗。最后,在方法论上,该研究展示了人工智能(XGBoost)与组学技术(代谢组学)强强联合的巨大威力,为今后在其他复杂疾病中挖掘生物标志物提供了可借鉴的成功范式。总之,李绍华等人的工作为攻克HBV相关肝病这一重大健康问题提供了新的见解和有力的工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号