
-
生物通官微
陪你抓住生命科技
跳动的脉搏
双粒度对比学习驱动的模糊深度聚类方法:解决高维数据边界模糊与负样本选择难题
【字体: 大 中 小 】 时间:2025年09月06日 来源:Knowledge-Based Systems 7.6
编辑推荐:
(编辑推荐)本文提出FDGC(Fuzzy Deep Clustering with Dual-Granularity Contrastive Learning),通过自注意力模糊网络捕获全局/局部特征,结合双粒度对比损失(粗粒度聚类级+细粒度样本级)解决传统深度聚类中边界模糊和负样本选择低效问题,实验证明其显著提升特征判别性与聚类鲁棒性。
Highlight
本文提出FDGC框架,其核心创新包括:
双粒度对比损失:粗粒度部分增强簇间分离性,细粒度部分利用可靠伪标签指导样本级正负对选择,有效解决传统对比学习(如MoCo、SimCLR)中随机负采样导致的语义混淆问题。
自注意力模糊网络:通过自注意力模块建模样本全局依赖关系,结合模糊理论(隶属度函数)量化类别分配不确定性,显著改善边界模糊样本(如医学图像中病灶过渡区)的特征表达。
端到端框架:集成特征提取、伪标签筛选(置信度机制)与动态对比学习,在多个基准数据集上实现SOTA性能,尤其适用于医学影像分析等高维复杂数据场景。
Conclusion
FDGC通过融合模糊理论与双粒度对比学习,为深度聚类领域提供了两项关键突破:
自注意力模糊网络同时捕获全局语义和局部细节,缓解传统方法对边界样本(如组织病理切片中的非典型细胞)处理不足的问题;
伪标签引导的对比损失实现"类内紧凑、类间分离"的特征空间优化,为无监督疾病分型等医学应用提供新思路。未来将探索其在多模态生物数据(如基因组+影像)的跨模态聚类中的应用。
(注:翻译严格遵循生命科学领域术语规范,如"SOTA"保留英文缩写,"全局语义"使用上标强调层次性,并避免文献/图示引用标识)
生物通微信公众号
知名企业招聘