
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度多核学习的单细胞RNA测序数据聚类方法scDMKC及其在细胞异质性解析中的应用
【字体: 大 中 小 】 时间:2025年07月26日 来源:Biochemical Engineering Journal 3.9
编辑推荐:
针对单细胞RNA测序(scRNA-seq)数据高维度、高稀疏性和非线性分离难题,研究人员提出深度多核细胞聚类网络scDMKC。该模型通过多核表征学习器自适应融合核函数,结合ZINB自监督策略同步优化表征与聚类,在5个真实数据集上显著超越现有方法,为肿瘤微环境解析和细胞分化轨迹追踪提供新工具。
单细胞RNA测序技术(scRNA-seq)近年来在癌症研究、免疫学和发育生物学等领域展现出巨大潜力,能够揭示肿瘤微环境中的细胞类型组成、解析免疫细胞功能状态,甚至追踪胚胎发育过程中的细胞分化轨迹。然而,这项技术产生的数据具有极端稀疏性(由dropout事件导致)、高变异性(overdispersion)以及"高维度、小样本"的特点。以Pollen数据集为例,仅包含301个细胞样本却需要分析11种神经亚型,传统聚类方法如K-means和层次聚类在如此高维稀疏数据面前显得力不从心。更棘手的是,现有深度学习方法虽然能提取复杂特征,却往往忽略聚类结构,导致学习到的表征难以线性分离。
针对这一系列挑战,贵州轻工职业技术学院的研究团队在《Biochemical Engineering Journal》发表创新成果。他们开发的深度多核细胞聚类网络scDMKC,通过多核表征学习与聚类联合优化的新范式,成功突破现有技术瓶颈。该研究采用四大核心技术:多尺度细胞表征编码器提取层次特征、自适应多核学习器融合高斯核/拉普拉斯核等函数、ZINB自监督解码器处理稀疏数据、以及基于KL散度的聚类模块,最终在5个真实数据集上实现聚类精度显著提升。
研究结果部分揭示多个重要发现:
这项研究的突破性在于首次将多核学习与深度聚类有机结合,针对scRNA-seq数据特性设计ZINB自监督框架。其创新点不仅体现在技术层面——如开发可解释的核函数组合策略(RBF核贡献度42%),更在于理论层面解决了表征学习与聚类目标割裂的难题。实际应用中,该模型对罕见细胞亚群的识别灵敏度达到92.4%,为肿瘤异质性研究和干细胞分化机制解析提供新工具。未来通过整合空间转录组数据,有望进一步推动精准医疗中的单细胞分析 pipelines 发展。
生物通微信公众号
知名企业招聘