基于参考向量引导进化算法的单细胞转录组聚类分析新方法RVEA-CAST及其在生物医学研究中的应用

《Computer Methods and Programs in Biomedicine》:Reference Vector-guided Evolutionary Algorithm for cluster analysis of single-cell transcriptomes

【字体: 时间:2025年06月06日 来源:Computer Methods and Programs in Biomedicine 4.9

编辑推荐:

  本研究针对单细胞RNA测序(scRNA-seq)数据聚类分析中多目标优化难题,开发了参考向量引导进化算法RVEA-CAST。通过设计三种问题导向的变异算子优化聚类偏差、紧密度和Davies-Bouldin指数(DBI),在10个真实数据集上验证显示NMI和ARI指标最高提升达66.7%和261.5%。该算法能有效识别细胞亚群,为构建人类细胞图谱和疾病特异性图谱提供新工具。

单细胞RNA测序(scRNA-seq)技术的出现彻底改变了转录组学研究范式,使科学家能够在单细胞分辨率下解析基因表达谱。这项技术虽然能揭示细胞异质性和稀有细胞亚群,但也面临着数据高噪声、高维度等技术挑战。其中,聚类分析作为scRNA-seq数据分析的关键步骤,直接影响着细胞类型鉴定和下游分析的准确性。然而现有聚类方法在处理多目标优化问题时存在性能瓶颈,难以平衡聚类质量指标间的冲突。

为解决这一难题,研究人员开发了参考向量引导进化算法RVEA-CAST。该方法创新性地将单细胞转录组聚类建模为多目标优化问题,同时优化聚类偏差、紧密度和Davies-Bouldin指数(DBI)三个指标。算法核心包括:1)采用PCA和UMAP进行数据降维;2)设计三种智能变异算子分别优化不同目标;3)基于参考向量实现目标空间划分和自适应搜索。在Ginhoux、Buettner等10个真实数据集上的测试表明,RVEA-CAST在标准化互信息(NMI)和调整兰德指数(ARI)指标上较现有方法最高提升66.7%和261.5%。

关键技术方法包括:1)使用贝叶斯信息准则(BIC)自动估计聚类数范围;2)设计分裂变异算子优化聚类偏差和紧密度;3)设计合并变异算子优化DBI;4)基于Das-Dennis方法生成参考向量;5)采用31次独立运行确保结果可靠性。测试数据集涵盖80-6418个细胞,来自人类和小鼠不同组织。

研究结果部分显示:在"5.4 比较评估"中,RVEA-CAST在8/10数据集上NMI显著优于MOGA和EMEP算法,在Buettner数据集上NMI提升20.6%;在"5.5 智能变异算子的重要性"中,剔除智能算子的版本IGD指标下降达61.6%;"5.7 生物学分析"表明,在Manno人脑中期数据集上,RVEA-CAST准确识别了与帕金森病相关的多巴胺能神经元亚群,GO富集分析发现"突触组织"(GO:0050808)、"轴突形成"(GO:0007409)等关键通路。

结论部分指出,RVEA-CAST通过多目标优化框架有效解决了scRNA-seq聚类中的指标冲突问题。其创新性体现在:1)动态调整聚类数量的变异算子;2)参考向量引导的并行子空间优化策略。该方法在保持计算效率的同时(6418个细胞数据集耗时约270秒),显著提高了聚类结果的生物学相关性。未来可通过整合批次校正等预处理步骤进一步提升在大型数据集上的性能。这项工作为构建高精度细胞图谱和发现疾病特异性生物标志物提供了新工具,相关成果发表在《Computer Methods and Programs in Biomedicine》上。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号