
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于血浆蛋白质组学的儿童结核病生物标志物发现:多国队列研究与机器学习驱动的诊断模型
【字体: 大 中 小 】 时间:2025年07月20日 来源:Nature Communications 14.7
编辑推荐:
本研究针对儿童结核病(TB)诊断难题,通过高通量血浆蛋白质组学分析511例多国儿童样本,结合机器学习方法鉴定出3-6个蛋白质组成的生物标志物组合(AUC 0.87-0.88),达到WHO筛查测试标准。该研究首次在儿童群体中发现WARS1等特异性标志物,为开发非痰液诊断工具提供新思路,对改善全球儿童结核病管理具有重要意义。
结核病仍是全球传染病致死的主要原因,儿童患者面临更严峻的诊断困境。由于难以获取合格痰标本,目前96%的儿童结核病死亡发生在未接受治疗的患者中。现有诊断方法灵敏度不足,特别是对HIV感染或营养不良患儿更易漏诊。这促使全球急需开发基于宿主反应的儿童特异性诊断标志物。
J. David Gladstone Institutes的研究团队在《Nature Communications》发表突破性研究,通过多中心合作收集511例来自非洲和南美四国的儿童样本,涵盖确诊TB、临床诊断TB和非TB呼吸道疾病组。研究采用数据非依赖采集(DIA-PASEF)质谱技术实现高通量血浆蛋白质检测(35分钟/样本),平均每个样本定量498种蛋白质,动态范围跨越4个数量级。通过机器学习筛选出3-6个蛋白质的最优组合,在独立验证集中达到90%敏感性和70%特异性的WHO标准。
研究首先通过质谱分析发现47个差异蛋白,其中色氨酰t-RNA合成酶(WARS1)在确诊TB组显著上调(log2FC=0.39),与色氨酸代谢通路激活相关。免疫球蛋白可变区(IGHV1-18等)的寡克隆表达提示特异性体液免疫应答。补体激活通路显著富集,反映结核分枝杆菌细胞壁成分引发的先天免疫反应。
通过LASSO回归筛选50个特征蛋白后,采用穷举法评估所有3-6蛋白组合。四蛋白模型(WARS1/APOM/TNC/CD44)表现最优,测试集AUC达0.88(95%CI 0.83-0.99)。单个蛋白诊断效能有限(AUC 0.58-0.75),组合后显著提升。载脂蛋白M(APOM)的下调(log2FC=-0.45)与结核病相关的脂代谢紊乱一致。
模型在115例临床诊断TB中预测63%为阳性,这些病例在蛋白质表达谱上与确诊TB高度相似。值得注意的是,所有模型均能区分活动性TB与潜伏感染,证明标志物组合对疾病状态的特异性。
该研究建立了首个经多国验证的儿童结核病血浆蛋白质诊断模型,其创新性体现在三方面:技术上实现微量血浆(1μL)的高通量检测;生物学上发现儿童特有的WARS1等标志物;临床上达到WHO筛查工具标准。标志物组合在资源有限地区尤其有价值,只需简单血液检测即可辅助诊断。未来需在婴幼儿、HIV感染等高风险亚群中进一步验证,并开发适合基层医疗的检测形式。这项工作为终结儿童结核病死亡提供了重要的诊断工具研发基础。
生物通微信公众号
知名企业招聘