
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习揭示肌萎缩侧索硬化症的三种独特生物亚型及其临床预测价值
【字体: 大 中 小 】 时间:2025年08月08日 来源:European Journal of Human Genetics 4.6
编辑推荐:
本研究通过机器学习分析ALS患者转录组数据,成功鉴定出三种具有不同病理特征的生物亚型:突触功能障碍型(34%)、神经元再生型(47%)和神经元退行型(19%)。研究人员利用非负矩阵分解(NMF)和随机森林分类器(RFC)揭示了各亚型特异的HERV-K(人类内源性逆转录病毒-K)表达模式和BDNF/JAK1/2通路调控机制,为ALS精准诊疗提供新靶点。该成果发表于《European Journal of Human Genetics》,对破解ALS异质性难题具有重要临床意义。
肌萎缩侧索硬化症(ALS)作为一种致命的神经退行性疾病,长期以来因临床异质性和病理机制复杂性困扰着科研人员。患者表现从发病年龄、症状进展到分子特征都存在显著差异,这使得药物开发举步维艰——过去三十年里,超过50项III期临床试验折戟沉沙。更棘手的是,约90%的ALS病例属于散发性,缺乏明确的遗传标记,传统基于临床症状的分类方法难以揭示潜在的病理机制。
美国国立卫生研究院国家神经疾病与中风研究所(National Institute of Neurological Disorders and Stroke, NIH)的Nicholas Pasternack团队联合多机构研究人员,创新性地将机器学习应用于297例ALS患者的死后组织转录组分析。他们发现ALS实际上包含三种分子特征迥异的亚型:突触功能障碍型表现为BDNF信号抑制和钙信号紊乱;神经元再生型显示强烈的胶质细胞激活和神经营养通路上调;而神经元退行型则呈现广泛的基因表达下调。相关成果发表在《European Journal of Human Genetics》上,为ALS的精准分型提供了首个可临床转化的生物标志物体系。
研究团队主要采用三大关键技术:1)非负矩阵分解(NMF)对皮层和脊髓样本进行无监督聚类;2) ingenuity通路分析(IPA)解析差异表达基因的生物学通路;3)基于纽约基因组中心(NYGC)队列的随机森林模型(RFC)实现临床数据预测分型。其中单细胞转录组数据来自23例患者的运动皮层样本,通过表达加权细胞类型富集(EWCE)验证了细胞特异性变化。
无监督聚类揭示三种ALS患者群体
通过NMF算法分析,皮层样本中47%患者归为神经元再生型(CTX_ALS_2),其特征是兴奋性神经元基因上调和微胶质细胞激活。34%属于突触功能障碍型(CTX_ALS_1),表现为抑制性神经元基因富集和JAK1/2通路抑制。最小的退行型(CTX_ALS_3,19%)则显示全基因组表达下调。脊髓样本呈现相似分布,但再生型比例更高(SC_ALS_3,48%)。
HERV-K的亚型特异性调控
在5个编码完整Env蛋白的HERV-K位点中,3q21.2和19q11在多个亚型中上调。值得注意的是,8p23.1和19q13.42仅在突触功能障碍型皮层样本中激活,而19q13.42的表达与神经元退行强烈相关,提示特定内源性逆转录病毒可能驱动疾病进展。
通路分析揭示核心调控机制
IPA显示突触功能障碍型特征性抑制BDNF和鸦片信号通路(Z-score<-2),同时激活干扰素γ和TNFα通路。再生型则显著上调STAT3(Z-score=3.1)和神经营养因子信号。退行型在所有通路中均呈现广泛抑制,特别是S100钙结合蛋白家族表达下降达4.2倍。
临床预测模型的建立
基于年龄、C9orf72重复序列长度等临床特征构建的RFC模型,对退行型亚型的预测准确率最高(平衡准确率79%)。其中发病年龄(重要性评分0.21)和种族(0.18)是关键预测因子,该模型AUC达0.86,显著优于随机分类。
这项研究首次系统论证了ALS存在三种病理机制明确的生物亚型,并建立了从分子特征到临床表型的完整关联框架。特别重要的是,研究发现不同亚型对HERV-K激活和BDNF信号通路的响应存在显著差异,这为开发靶向治疗提供了新方向:如对突触功能障碍型患者使用JAK抑制剂,而对再生型患者采用神经营养因子增强策略。研究人员开发的临床预测模型,使得在缺乏复杂分子检测的情况下实现亚型分类成为可能,将显著提升未来临床试验的患者分层效率。
该研究也存在一定局限,如死后组织仅反映终末期病理变化,未来需要开展纵向研究追踪亚型动态演变。作者建议将NMF与其他聚类算法结合,并开发考虑疾病进程的时间序列模型,以更精准地把握治疗时间窗。这些发现不仅为ALS诊疗带来新曙光,也为其他复杂神经退行性疾病的异质性研究提供了范式参考。
生物通微信公众号
知名企业招聘