基于K近邻粒度球优化的密度峰值聚类算法GBK-DPC研究

【字体: 时间:2025年08月12日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出了一种改进的密度峰值聚类算法GBK-DPC(Granular Ball K-nearest neighbor Density Peak Clustering),通过自适应粒度球(GB)划分机制和双因子密度估计(结合内部紧密度与K近邻全局代表性),显著提升了复杂数据边界识别能力。创新性引入动态分配策略,有效解决了传统DPC算法(Density Peak Clustering)的"多米诺效应"和阈值敏感性问题,在23个数据集上验证了其优越性能。

  

亮点与结论

密度峰值聚类(DPC)

DPC算法的核心是通过数据点局部密度和相对距离构建决策图来识别聚类中心。聚类中心具有两个关键特征:首先它是密度峰值点,局部密度高于邻近点;其次不同聚类中心之间的距离较大。

提出方法

本节详细描述了GBK-DPC算法流程(如图1所示)。该算法首先生成稳定的粒度球(GB),然后自适应识别并优化半径较大且数据分布不均匀的GB。基于优化后的GB,通过整合GB内部紧密度和k近邻密度来计算局部密度。在确定聚类中心后,采用动态分配策略,利用已知...

实验与分析

为验证GBK-DPC算法的聚类效果,我们在合成数据集和真实数据集上进行了测试。表1展示了8种对比算法的相关信息。在K-means时间复杂度O(nT)中,T表示迭代次数。DPC、FastDPeak和GB-DP使用Python实现,DPC-KNN-PCA和DLORE-DP使用MATLAB开发。K-means和谱聚类(Spectral clustering)算法调用sklearn包方法...

结论

本文提出的GBK-DPC算法在三方面进行改进:1)采用自适应方法优化GB;2)使用双因子方法评估每个GB的局部密度(同时考虑k近邻GB距离和内部数据紧密度)。由于GB数量远少于数据点,构建...

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号