
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习算法与单细胞测序分析的阿尔茨海默病生物标志物鉴定与验证研究
【字体: 大 中 小 】 时间:2025年05月07日 来源:Computational Biology and Chemistry 2.6
编辑推荐:
本研究针对阿尔茨海默病(AD)发病机制不明、早期诊断困难的问题,通过整合GEO数据库转录组数据(GSE122063、GSE132903)和单细胞测序(GSE157827等),结合LASSO、SVM-RFE、Random forest三种机器学习算法筛选出6个核心基因(CD86、SCG3等),其中SCG3在AD组显著下调且诊断AUC达0.927。研究首次系统验证SCG3作为AD早期诊断标志物的潜力,为临床干预提供新靶点。
阿尔茨海默病(Alzheimer's disease, AD)作为威胁全球老龄化人群健康的"沉默杀手",其发病机制至今仍是未解之谜。传统诊断依赖临床症状和神经影像学,往往在患者脑部已出现不可逆损伤时才确诊,错失黄金干预窗口。随着全球AD患者预计2050年突破1亿,寻找早期生物标志物成为破解这一困局的关键。
中国研究人员通过多组学融合策略展开攻关。研究团队从GEO数据库获取295例样本(153 AD/142对照)的转录组数据(GSE122063、GSE132903),结合单细胞测序数据集(GSE157827等),运用机器学习三重奏——LASSO(最小绝对收缩选择算子)、支持向量机递归特征消除(SVM-RFE)和随机森林(RF),从379个差异表达基因(DEGs)中筛选出6个核心基因:CD86、SCG3、VGF、PRKCG、SPP1和TPI1。其中分泌颗粒蛋白SCG3在AD组表达量断崖式下跌,其受试者工作特征曲线下面积(AUC)在训练集和验证集分别达到0.845和0.927,展现出卓越的诊断效能。单细胞解析更揭示SCG3在神经元等细胞中的特异性表达模式,动物实验通过免疫荧光证实AD模型海马体SCG3表达显著降低。这项发表于《Computational Biology and Chemistry》的研究,首次系统验证SCG3作为AD早期诊断标志物的临床潜力。
关键技术路线包含:1) GEO数据库295例样本转录组meta分析;2) 机器学习三维筛选(LASSO/SVM-RFE/RF);3) 单细胞测序解析细胞异质性;4) 免疫荧光动物验证。
【数据收集】整合4个GEO数据集(GSE122063等),涵盖196例HumanHT-12 v4芯片数据和100例Agilent微阵列数据,建立AD/对照转录组图谱。
【DEGs筛选与功能分析】鉴定379个DEGs(115上调/264下调),GO分析显示这些基因富集于突触膜(synaptic membrane)等神经功能相关通路,提示突触功能障碍可能是AD关键病理机制。
【机器学习特征筛选】LASSO回归压缩出12个候选基因,SVM-RFE锁定8个特征基因,RF算法最终确定6个核心基因,其中SCG3在三种算法中均被捕获。
【单细胞验证】分析12,743个单细胞转录组,发现SCG3在兴奋性神经元中表达量随AD进展呈阶梯式下降,与临床样本趋势高度一致。
【动物实验】APP/PS1转基因小鼠海马区免疫荧光显示,SCG3信号强度较野生型降低62.3%,从蛋白水平验证转录组发现。
这项研究的突破性在于首次通过多模态数据融合,将机器学习预测与单细胞分辨率验证相结合,不仅发现SCG3这一高特异性诊断标志物,更揭示其在AD病理进程中的动态变化规律。讨论部分指出,SCG3作为神经分泌颗粒的关键组分,其表达异常可能直接影响突触可塑性,这为理解AD发病机制提供了新视角。研究者特别强调,SCG3的诊断效能超越现有临床标志物(如Aβ42),且能在症状出现前检测到变化,真正实现"早于症状的诊断"。该成果不仅为AD早期筛查提供新工具,其采用的"计算预测-实验验证"研究范式,也为其他复杂疾病生物标志物发现提供了可借鉴的技术路线。
生物通微信公众号
知名企业招聘