CD44、ACAN、PLVAP和HBEGF作为糖尿病视网膜病变的DNA甲基化相关生物标志物的多组学鉴定与功能研究
【字体:
大
中
小
】
时间:2025年10月05日
来源:Diabetes, Metabolic Syndrome and Obesity 2.8
编辑推荐:
本刊推荐:本研究通过整合DNA甲基化组、转录组及单细胞测序数据,结合孟德尔随机化(MR)与机器学习算法,首次系统鉴定出CD44(PDR阶段)和ACAN/PLVAP/HBEGF(NPDR阶段)四个DNA甲基化调控的关键生物标志物。研究揭示这些基因通过核糖体、溶酶体、氧化磷酸化及P53信号通路等机制参与DR进展,并在中性粒细胞/单核细胞中特异性表达。免疫浸润分析显示其与效应记忆CD4+T细胞等免疫细胞显著相关,ROC曲线验证其诊断效能(AUC>0.7),为DR的早期诊断和靶向治疗提供新策略。
材料与方法
研究采用多组学整合分析策略,从Gene Expression Omnibus(GEO)数据库获取糖尿病视网膜病变(DR)相关数据集,包括增殖性糖尿病视网膜病变(PDR)的RNA-seq数据集GSE102485和GSE94019、非增殖性糖尿病视网膜病变(NPDR)数据集GSE160306、DNA甲基化数据集GSE57362以及单细胞RNA测序(scRNA-seq)数据集GSE165784(人纤维膜样本)和GSE205123(小鼠视网膜样本)。通过sva包中的Combat_seq算法整合批次效应,使用champ包进行DNA甲基化数据的质控、噪声消除和标准化,采用limma包进行差异甲基化探针(DMP)和差异甲基化区域(DMR)分析。差异表达基因(DEGs)通过DESeq2包识别,设定Benjamini-Hochberg校正后P<0.05且|log2FC|>1.5为阈值。甲基化调控的差异表达基因(MeDEGs)为DMGs与DEGs的交集。使用STRING数据库构建蛋白质-蛋白质相互作用(PPI)网络,并通过Cytoscape软件的MNC、degree和EPC算法筛选核心基因。孟德尔随机化(MR)分析以核心基因为暴露因素、DR为结局,采用FiveSampleMR包中的逆方差加权(IVW)等五种算法评估因果关系,并进行异质性检验、水平多效性检验和留一法敏感性分析。机器学习部分通过LASSO回归和SVM-RFE算法筛选生物标志物。功能富集分析采用基因集富集分析(GSEA),基于MSigDB中的KEGG基因集。竞争性内源RNA(ceRNA)网络通过TargetScan和Starbase数据库预测miRNA和lncRNA相互作用。单细胞数据分析使用Seurat包进行质控、标准化、PCA降维和UMAP聚类,并通过ScMayoMap函数注释细胞类型。免疫浸润分析采用ssGSEA算法评估28种免疫细胞比例,并通过Spearman相关分析探究生物标志物与免疫细胞的关联。最后通过rms包构建列线图(Nomogram),并使用ROC曲线、校准曲线和决策曲线评估诊断效能。
结果
DMGs、DEGs和MeDEGs的鉴定
在DNA甲基化数据集GSE57362中,共识别出125个DMRs(包含1059个CpG位点)和10,617个DMGs(包括2290个下调基因和8327个上调基因)。在整合后的PDR RNA-seq数据集中,发现2196个DEGs(1006个上调和1190个下调),NPDR数据集中鉴定出27个DEGs(8个上调和19个下调)。通过交集分析,得到1283个PDR MeDEGs和12个NPDR MeDEGs。
PDR生物标志物的筛选与验证
PPI网络分析筛选出41个核心基因,MR分析进一步鉴定出CD44、PTPRC和MYD88与PDR存在显著因果关系(OR<1,P<0.05)。LASSO和SVM-RFE机器学习算法共同确定CD44为PDR的关键生物标志物。实验验证显示,CD44在氧诱导视网膜病变(OIR)小鼠模型视网膜和PDR患者玻璃体液中显著高表达(P<0.01)。
NPDR生物标志物的筛选与验证
基于12个NPDR MeDEGs,LASSO回归识别出ACAN、PLVAP、EGR3、HBEGF等8个特征基因,SVM-RFE筛选出ACAN、PLVAP、AGXT和HBEGF。取交集后确定ACAN、PLVAP和HBEGF为NPDR生物标志物。qRT-PCR验证显示,ACAN和PLVAP在T1DM/T2DM小鼠视网膜中上调,HBEGF在T1DM模型中下调(P<0.0001)。
功能富集与ceRNA网络
GSEA分析表明,CD44显著富集于核糖体、溶酶体、抗原处理与呈递等96条通路;ACAN参与核糖体和氧化磷酸化等30条通路;PLVAP关联核糖体、氨酰tRNA生物合成等40条通路;HBEGF涉及P53信号通路和细胞因子-受体相互作用等28条通路。ceRNA网络构建出包含23个lncRNA和14个miRNA的调控网络。
单细胞表达与免疫浸润
scRNA-seq分析显示,在PDR患者纤维膜中,CD44高表达于单核/巨噬细胞,ACAN在干细胞中富集,PLVAP和HBEGF在内皮细胞中高表达。在DM小鼠视网膜中,PLVAP和HBEGF主要位于中性粒细胞,CD44在巨噬细胞中表达。免疫浸润分析发现PDR样本中活化CD4+T细胞、巨噬细胞等22种免疫细胞浸润升高,NPDR中效应记忆CD4+T细胞增加而Th17细胞减少。相关性分析显示CD44与多数免疫细胞正相关(除Th2细胞),ACAN与效应记忆CD4+T细胞正相关(r=0.33),HBEGF与其负相关(r=?0.48)。
诊断效能与药物预测
ROC曲线验证CD44对PDR的诊断效能(AUC=0.964),ACAN、PLVAP和HBEGF对NPDR的AUC值分别为0.897、0.770和0.724。列线图模型显示良好预测精度(AUC=0.91),决策曲线证实其临床适用性。药物相互作用网络预测多种FDA已批准和未批准药物靶向CD44和HBEGF。
讨论
本研究通过多组学整合分析,首次系统鉴定出CD44、ACAN、PLVAP和HBEGF作为DR不同阶段的DNA甲基化相关生物标志物。这些基因通过调控核糖体功能、氧化应激、炎症反应和血管生成等途径参与DR进展。单细胞解析揭示其在中性粒细胞和巨噬细胞中的特异性表达,提示免疫细胞在DR病理中的核心作用。免疫浸润分析进一步证实T细胞和B细胞亚群的失衡与疾病阶段密切相关。研究的局限性包括跨物种数据验证不足和缺乏外部临床队列验证,未来需结合大样本和功能实验深入探索机制。
结论
CD44、ACAN、PLVAP和HBEGF作为甲基化调控的关键分子,在DR发生发展中发挥重要作用,并表现出优异的诊断价值,为DR的早期干预和靶向治疗提供了新的候选标志物和策略。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号