基于全血基因表达谱的肌萎缩侧索硬化症诊断、预后预测及治疗候选药物发现研究

《Nature Communications》:Gene expression signatures from whole blood predict amyotrophic lateral sclerosis case status and survival

【字体: 时间:2025年11月01日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对肌萎缩侧索硬化症(ALS)诊断延迟和预后预测困难等临床挑战,通过对422例ALS患者和272例对照的全血RNA测序分析,开发了高性能的XGBoost机器学习分类器,在独立外部验证队列中AUC达0.894。整合基因表达特征与临床变量可有效区分患者生存期,并通过通路富集和药物扰动分析发现8个潜在治疗候选药物,为ALS精准医疗提供了新策略。

  
在神经退行性疾病领域,肌萎缩侧索硬化症(ALS)一直是一个极具挑战性的疾病。这种进行性、致命性的神经系统疾病中位生存期仅为2-4年,但确诊过程却异常艰难。患者从出现症状到获得明确诊断平均需要5-15个月,有些甚至长达19个月。这种诊断延迟不仅延误了标准治疗药物利鲁唑的及时使用,还使患者错过了参与临床试验的最佳时机。
目前ALS诊断主要依赖临床症状和神经生理学检查,缺乏特异性的生物标志物。神经丝轻链(NfL)作为最有前景的候选标志物,虽然在ALS患者中显著升高,但由于其在阿尔茨海默病、帕金森病、多发性硬化等多种神经系统疾病中都会异常表达,缺乏疾病特异性。这种困境促使研究人员寻找更可靠的生物标志物解决方案。
在这项发表于《Nature Communications》的研究中,研究团队开创性地利用全血基因表达谱开发了一套综合性的ALS诊断、预后和治疗发现平台。他们假设外周血中的基因表达特征能够反映ALS的病理生理过程,从而为这一致命性疾病提供新的解决方案。
关键技术方法
研究团队收集了422例ALS患者和272例对照的全血样本进行RNA测序(RNA-seq),检测了超过22,000个蛋白编码基因、长链非编码RNA和microRNA。采用多种机器学习算法(包括XGBoost、LASSO、弹性网络等)构建诊断和预后预测模型,并通过DNA甲基化数据校正免疫细胞比例的影响。利用通路富集分析识别疾病相关通路,并通过药物扰动分析筛选潜在治疗候选药物。所有分析均在内部队列和独立外部队列(Grima等数据集)中进行验证。
基因表达特征区分ALS病例与对照
研究团队在ALS患者与对照之间鉴定出3,640个差异表达基因(DEGs),其中1,999个基因上调,1,641个基因下调。许多差异基因与免疫系统相关,如IL2RB、S100A8、S100A9、S100A12等,这与ALS中存在免疫失调的报道一致。
值得注意的是,上调最显著的DEGs中包含E3泛素连接酶MARCHF7、囊泡和内体运输蛋白(SNX13、RAB8B、ZFYVE16)、自噬蛋白VMP1以及肌肉蛋白CAPZA1和CAPZA2。而下调的DEGs中则包含与表观遗传学(DNMT1、EP400)、炎症(ILF3)和凋亡(MADD)相关的基因。研究人员还通过qPCR在独立验证队列中证实了五个上调基因的表达变化,验证了转录组数据的可靠性。
基因表达特征预测ALS病例状态
研究团队比较了七种机器学习算法在区分ALS病例与对照方面的表现,发现XGBoost算法表现最佳,曲线下面积(AUC)达到0.91,显著优于其他算法。通过递归特征消除,研究人员最终确定了三个基因面板(27基因、30基因和29基因)以及一个组合的46基因面板。
在内部测试中,这些基因面板的AUC介于0.969-0.972之间,灵敏度为93.2-94.2%,特异度为86.0-87.9%。更重要的是,在完全独立的Grima等外部测试数据集中,组合基因面板仍能达到0.894的AUC,表现出优异的泛化能力。这是首次有研究报告ALS血液基因表达分类器在独立外部验证中取得如此高的准确性。
基因表达特征预测ALS生存期
除了诊断应用外,研究团队还探索了基因表达特征在预后预测中的价值。他们将基因特征与临床变量(发病部位、症状发生年龄、性别)相结合,构建了生存预测模型。
结果显示,结合基因特征的逐步回归模型和XGBoost模型在预测2-8年生存率方面均优于仅使用临床变量的模型。在外部数据集中,XGBoost模型能够将患者区分为预测的较短、中间和较长生存期组别,组间中位生存期差异分别为1.31年和3.20年,优于临床变量单独模型。这表明整合基因表达数据可以增强对ALS患者预后的分层能力。
血液转录组通路分析揭示ALS疾病特征
为了探索血液中是否包含ALS相关的疾病特征,研究人员进行了通路富集分析。在调整免疫细胞比例后,多个神经退行性病变通路在ALS患者中显著富集,包括"肌萎缩侧索硬化症"、"亨廷顿病"和"帕金森病"通路。其他ALS相关通路如"氧化磷酸化"、"热生成"和"蛋白酶体"也显示出类似的富集模式。
特别值得注意的是,"核质运输"通路在调整细胞比例后新出现,该通路包含C9orf72、TBK1和CHMP2B等已知的ALS相关基因。基因本体(GO)分析还揭示了与RNA加工和剪接、电子传递链能量产生等ALS病理生理过程相关的通路富集。
药物扰动分析发现ALS治疗候选药物
研究人员通过识别血液转录组数据与iPSC来源的神经元和死后脊髓组织中共有的"核心基因",进行了药物扰动分析。
分析发现了8个能够逆转疾病转录组特征的候选药物,包括突变EGFR抑制剂AZD-9291、MEK5/ERK5抑制剂BIX-02189、多激酶抑制剂BX-795、DNA合成抑制剂氟达拉滨、BTK抑制剂伊布替尼、抗肾上腺素和抗多巴胺药物三氟拉嗪、多柔比星类似物戊柔比星以及自噬靶向药物XMD-1150。其中三氟拉嗪和伊布替尼已有文献支持其在ALS中的潜在治疗价值,而其他药物则为全新发现。
研究结论与意义
这项研究代表了ALS生物标志物开发的重要进展。通过大规模全血转录组分析,研究团队不仅开发出高性能的诊断分类器,还建立了整合基因特征的预后预测模型,同时通过通路分析和药物筛选为ALS治疗发现了新的候选药物。
研究的独特优势在于其大样本量、高覆盖度的RNA测序技术、严格的数据质量控制、在独立外部数据集中的验证以及多角度的分析策略。这些因素共同确保了研究结果的可靠性和临床转化潜力。
值得注意的是,类似于乳腺癌中成功应用的PAM50基因表达面板,这项研究为开发临床可应用的ALS基因表达面板奠定了基础。未来,这种血液基因表达特征有望加速ALS的诊断过程,为患者提供更准确的预后信息,甚至指导个性化治疗选择。
尽管研究存在一些局限性,如未包含ALS模拟病例和症状前突变携带者,但其为ALS精准医疗开辟了新的道路。随着进一步的研究验证,这种基于血液基因表达特征的方法有望显著改善ALS的临床管理,为这一致命性疾病带来新的希望。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号