
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于有效距离与密度的非参数深度图聚类方法DeepEDD研究
【字体: 大 中 小 】 时间:2025年09月05日 来源:Neurocomputing 6.5
编辑推荐:
本文提出了一种创新的非参数深度图聚类框架DeepEDD,通过有效距离(Effective Distance)和密度(Density)算法实现端到端的聚类数k自动预测,解决了传统参数化方法需预设k值的局限性。该模型融合图掩码自编码器(Graph Masking Autoencoder)与多项式曲线拟合技术,在6个公开数据集上超越现有非参数方法(含经典与深度模型),其掩码机制显著提升了泛化性能。
亮点
• 提出首个基于有效距离与密度(EDD)的非参数深度图聚类算法,通过改进的密度峰值算法(CFSFDP)自动确定聚类数k
• 设计新型融合损失函数,并完成收敛性证明
• 首次将图掩码自编码器(Graph Masking Autoencoder)应用于聚类数预测任务,显著提升模型泛化能力
• 在6个数据集上的实验表明,本方法超越现有非参数基线模型
方法
算法框架包含图像掩码融合编码器和双解码器:输入图数据经编码器生成混合嵌入(含掩码编码和自编码器AE编码),通过多目标重构模块处理后,由自优化模块进行精细化调优。核心创新点EDD算法将图拓扑关系映射至内积空间,结合熵策略与多项式拟合自动确定最优k值,突破传统CFSFDP依赖人工调参的限制。
理论推导与证明
本节重点阐述新型损失函数的设计原理:通过数学推导验证了融合损失对嵌入质量的提升作用,并证明EDD解码器在拓扑信息提取中的有效性。实验数据与理论公式共同支撑了方法的鲁棒性。
结论
DeepEDD通过融合图掩码自编码器与原创EDD算法,实现了非参数图聚类领域的突破。数学计算证实其性能优于现有方法,尤其在未知真实k值的场景下展现显著优势,为无监督学习提供了新范式。
生物通微信公众号
知名企业招聘