基于可解释机器学习和转录组学的年龄相关性黄斑变性细胞特异性免疫特征解析

【字体: 时间:2025年06月15日 来源:npj Genomic Medicine 4.7

编辑推荐:

  本研究针对年龄相关性黄斑变性(AMD)免疫机制不清的问题,通过整合机器学习与多组学数据,建立了能区分AMD与对照的81基因标志物(AUC-ROC 0.80),发现小胶质细胞和星形胶质细胞的特异性免疫特征,并鉴定出PLCG2基因新变异rs4133124。该研究为AMD的精准诊疗提供了新靶点。

  

年龄相关性黄斑变性(AMD)作为全球50岁以上人群不可逆视力丧失的首要原因,影响着近千万美国人的健康。随着人口老龄化加剧,预计到2050年患者数量将翻倍。尽管全基因组关联研究(GWAS)已鉴定出34个风险位点,但约80%的遗传力仍无法解释,且非编码变异如何通过调控基因表达影响疾病进程尚不明确。更关键的是,视网膜作为高度异质性的神经组织,其免疫细胞在AMD中的精确作用机制始终是未解之谜。

为破解这些难题,来自美国的研究团队在《npj Genomic Medicine》发表创新性研究。该团队开发了可解释机器学习(ML)分析流程,整合453例死后视网膜转录组、单细胞测序和GWAS数据。通过极端梯度提升(XGB)算法筛选出81个特征基因,构建了区分AMD与对照的高效分类模型(AUC-ROC 0.80)。研究首次揭示这些基因主要富集于小胶质细胞和星形胶质细胞,并通过数字反卷积证实AMD中存在显著的胶质细胞比例变化。进一步整合GWAS数据发现PLCG2基因调控变异rs4133124与AMD的新关联。

研究采用四大关键技术:1)基于ANOVA、AUC和Kruskal-Wallis的多重特征选择从453例视网膜转录组中筛选标志物;2)应用XGBoost等算法构建分类模型并进行SHAP值解释;3)利用CIBERSORTx等工具对混合转录组进行细胞组分反卷积;4)结合AMD-GWAS数据和荧光素酶报告实验验证功能变异。样本来源于105例对照和348例不同阶段AMD患者的死后视网膜组织。

特征选择和机器学习模型揭示81个AMD核心基因
通过三重特征选择方法从166个样本中鉴定出81个跨方法一致的基因标志物。XGBoost模型展现出最佳分类性能(AUC-ROC 0.80),显著优于GWAS邻近基因(AUC-ROC 0.72)和文献报道基因。SHAP分析显示MOXD1等基因的表达差异对分类贡献最大。值得注意的是,AMD样本的预测错误率(18%)是对照组(9%)的两倍,提示疾病存在更强的分子异质性。

基因共表达网络分析连接ML基因与AMD相关通路
加权基因共表达网络分析(WGCNA)显示62/81的ML基因富集于免疫反应、补体和细胞外基质(ECM)三大模块。其中补体模块在AMD网络中呈现独特重构,PSMB8等蛋白酶体基因成为新的枢纽节点。与已知AMD-GWAS基因的共表达分析揭示,晚期AMD中70/81 ML基因与8个GWAS基因存在强相关性(r2

0.7),而在对照组仅7个基因相关。

AMD疾病进展存在共享和独特的基因特征
早期和中期AMD分别鉴定出57和62个特征基因,模型性能随疾病进展提升(AUC-ROC从0.62升至0.80)。值得注意的是,早期AMD基因在晚期预测中表现良好(AUC-ROC 0.74),而中期基因则未显示此特性,暗示AMD进展可能非连续。所有阶段的特征基因均富集于免疫和ECM通路,但模块保存分析显示补体通路在疾病中特异性改变。

ML基因在视网膜特定细胞类型中表达并受AMD影响
数字反卷积揭示AMD中小胶质细胞比例持续增加,星形胶质细胞在早晚期变化显著。单核RNA测序证实21/81 ML基因在小胶质细胞等胶质细胞中差异表达,如补体基因C1R在AMD小胶质细胞下调10倍。独立数据验证显示APOE等已知AMD基因也在胶质细胞中异常表达。

AMD特征基因富集AMD相关变异
量化-量化(Q-Q)图显示晚期AMD的81基因显著偏离无效分布。在PLCG2基因内含子区发现新变异rs4133124(p=2.59×10-6
),荧光素酶实验证实其具有增强子活性(3.5倍激活)。该位点位于视网膜开放染色质区,且在灵长类中高度保守,提示其在调控神经胶质功能中的进化重要性。

这项研究通过创新性的多组学整合策略,首次系统描绘了AMD的细胞特异性免疫图谱。三大发现尤其值得关注:首先,机器学习筛选的81基因标志物不仅具有诊断价值,更指向小胶质细胞-星形胶质细胞轴在AMD中的核心作用;其次,补体通路在疾病状态下的动态重构提示免疫调节失衡是AMD进展的关键驱动力;最后,PLCG2作为新发现的风险基因,将自身炎症与神经退行性疾病机制联系起来。这些发现为开发针对特定细胞类型的精准干预策略提供了分子基础,也为理解其他神经退行性疾病的免疫机制提供了新视角。

研究也存在若干局限:样本量限制(特别是中期AMD组),死后组织可能存在的转录组变化,以及需要进一步验证rs4133124的等位基因特异性效应。未来研究可结合空间转录组和活体成像技术,动态追踪胶质细胞在AMD病程中的时空变化规律。总体而言,这项工作展示了可解释机器学习在破解复杂疾病异质性方面的强大潜力,为AMD的早期诊断和分层治疗开辟了新途径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号