基于机器学习算法鉴定慢性阻塞性肺疾病中端粒维持相关生物标志物及其调控机制

【字体: 时间:2025年07月23日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对慢性阻塞性肺疾病(COPD)加速肺衰老的临床难题,通过机器学习算法筛选出RMI1、RAD51、RAD52、SNRNP70和CHEK1五个端粒维持相关基因标志物。研究结合GSEA、GSVA和分子对接技术,揭示这些基因通过调控中性粒细胞等免疫细胞参与COPD进展,其中CHEK1与U-0126等药物分子存在强相互作用。该成果为COPD早期诊断提供新靶点,发表于《Scientific Reports》。

  

慢性阻塞性肺疾病(COPD)作为进行性呼吸系统疾病,其发病机制与端粒缩短加速肺衰老密切相关。尽管现有治疗可缓解症状,但疾病进展的分子机制仍不明确。端粒作为染色体末端的保护结构,其长度异常与COPD患者白细胞和肺泡细胞的病理改变相关,但具体调控网络尚未系统解析。

江苏省南通市如皋人民医院呼吸与危重症医学科的研究团队在《Scientific Reports》发表研究,通过整合机器学习与多组学分析,首次建立端粒维持基因与COPD的分子关联。研究利用GEO数据库获取外周血转录组数据,采用随机森林(RF)、广义线性模型(GLM)、XGBoost和支持向量机(SVM)四种算法筛选标志物,结合GSEA、GSVA分析通路活性,并通过CIBERSORT算法解析免疫微环境,最终通过RT-qPCR和分子 docking 验证靶点。

关键技术包括:1) 从GSE112811和GSE146560数据集获取42例COPD和30例对照样本的转录组数据;2) 使用limma包筛选差异表达基因(DEGs)并与TelNet数据库2086个端粒维持基因取交集;3) 通过STRING构建蛋白质互作网络(PPI),CytoHubba算法鉴定核心基因;4) 采用四种机器学习模型评估基因诊断效能;5) 利用CMap数据库预测靶向药物并进行分子对接验证。

研究结果
差异基因筛选与功能分析
共鉴定1090个DEGs(495上调/595下调),与端粒维持基因取交集获得151个关键基因。GO分析显示这些基因富集于组蛋白修饰、DNA代谢调控等过程,KEGG通路涉及同源重组和沙门氏菌感染等。

机器学习模型构建
XGBoost模型表现最优(AUC>0.9),筛选出RMI1、RAD51、RAD52、SNRNP70和CHEK1五个标志物。诺模图显示联合诊断效能显著,校准曲线拟合良好。

通路与免疫调控机制
GSVA揭示CHEK1激活DNA修复通路,RAD51抑制mTORC1信号。免疫相关分析发现RMI1与中性粒细胞呈正相关(p<0.05),暗示其通过促炎作用参与COPD进展。

分子对接与实验验证
预测CHEK1与U-0126(MAPK抑制剂)等5种药物结合能最佳。RT-qPCR证实SNRNP70和RAD52在COPD患者中差异表达(p<0.05)。

结论与意义
该研究首次系统阐明端粒维持基因通过调控DNA修复(如RAD51介导的同源重组)、免疫细胞浸润(如中性粒细胞活化)等机制参与COPD进展。发现的五个标志物在训练集和验证集的AUC分别达0.65-0.9,为无创诊断提供新工具。分子对接提示现有药物(如KN-62)或可老药新用,为靶向治疗开辟路径。局限性在于XGBoost模型需更大队列验证,基因功能机制有待体内实验深入解析。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号