基于图融合的多视角单细胞RNA测序聚类算法scMCGF:提升细胞异质性解析精度的新策略

【字体: 时间:2025年05月26日 来源:Briefings in Bioinformatics 6.8

编辑推荐:

  针对单细胞RNA测序(scRNA-seq)数据高维性和高频丢失事件导致的聚类难题,安徽大学团队开发了基于图融合的多视角聚类算法scMCGF。该方法整合PCA线性特征、扩散映射非线性特征和细胞通路评分矩阵,通过自适应加权融合学习构建统一图矩阵,在13个真实数据集上CA、NMI和ARI指标均优于8种现有方法,为下游生物医学分析提供了更可靠的细胞分型基础。

  

在生命科学领域,单细胞RNA测序(scRNA-seq)技术革命性地实现了单个细胞转录组的解析,为揭示细胞异质性和生物系统复杂性提供了全新视角。然而,这项技术产生的数据具有典型的高维度特性——每个细胞需要检测数万个基因的表达量,同时存在普遍的技术噪声和"丢失事件"(dropout events),即基因表达量被错误检测为零值的情况。这些特性使得准确识别细胞类型这一基础分析任务面临巨大挑战,而细胞分型的准确性又直接关系到疾病机制研究、精准医疗和药物开发的可靠性。

当前主流的单细胞聚类方法主要存在三个局限性:一是依赖基因表达层面的相似性计算,忽视了通路等生物学背景信息;二是采用固定的K近邻图结构,无法在优化过程中动态调整;三是仅从单一视角提取特征,难以全面捕捉数据的复杂结构。虽然已有研究尝试整合图神经网络(GNN)或低秩表示(LRR)等算法,但在处理复杂组织样本时仍存在细胞亚群混淆、小群体被合并等问题。

安徽大学人工智能学院的研究团队在《Briefings in Bioinformatics》发表的研究中,提出了创新性的scMCGF算法。这项研究通过多视角数据构建和图融合技术的有机结合,不仅显著提升了聚类精度,还建立了可解释的生物特征关联。研究人员首先从四个互补视角构建特征矩阵:原始基因表达数据(View1)、细胞通路评分矩阵(View2)、主成分分析(PCA)提取的线性特征(View3)和扩散映射(DMs)提取的非线性特征(View4)。其中通路评分矩阵通过AUCell算法计算,反映细胞在生物通路活动水平的差异。随后采用自适应加权融合策略,迭代优化各视角相似图矩阵(S1-S4)与统一图矩阵(U),最终通过对U的Laplacian矩阵施加秩约束直接获得聚类结果,无需额外聚类算法。

关键技术方法包括:1)基于13个公开scRNA-seq数据集构建多视角特征(样本量466-34,558细胞);2)采用PCA和扩散映射分别提取线性和非线性特征;3)AUCell算法计算细胞-通路评分矩阵;4)自适应图融合学习框架同步优化各视角相似图和统一图;5)基于Ky Fan定理的秩约束聚类策略。

研究结果部分显示:
【性能比较】在Darmanis等13个数据集上,scMCGF的聚类准确率(CA)在12个数据集领先,最高达0.95;标准化互信息(NMI)和调整兰德指数(ARI)指标在多数数据集显著优于SC3、Seurat等8种对比方法。例如在Sanderson数据集,其NMI比次优方法提高29.9%。

【参数分析】确定邻域数k的最优值:细胞量<3000时k=5,>3000时k=15,此时ARI值趋于稳定。

【消融实验】移除任一视角均导致性能下降,如Baron-human数据集去除通路特征使ARI降低14.4%,证实多视角整合的必要性。

【鲁棒性】数据降采样至40%时,各指标波动<5%,显示算法对数据缺失的稳定性。

【生物学验证】在Qx_limb_muscle数据集中:1)预测簇与真实类型的DEGs重叠率>95%;2)KEGG富集显示B细胞显著关联"造血细胞谱系"通路(p<0.01);3)COSG鉴定的标记基因CD3D/CD3E与PanglaoDB数据库一致;4)Xin数据集中β细胞标记基因ADCYAP1表达模式与金标准高度吻合。

这项研究通过三个创新点推动了领域发展:一是首创将通路特征与多模态降维特征融合的框架,突破传统单视角局限;二是提出动态图学习机制,克服固定K近邻图的僵化问题;三是通过Laplacian矩阵秩约束实现"聚类即优化"的新范式。这些创新使scMCGF在保持算法鲁棒性的同时,对复杂样本(如肿瘤微环境)展现出更精细的分辨能力,为精准医学研究提供了更可靠的细胞图谱基础。未来可进一步拓展至单细胞多组学数据整合分析,或通过并行计算提升大规模数据处理效率。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号