IncGridDBC:面向流式数据的网格划分增量密度聚类算法及其在动态环境中的高效应用

【字体: 时间:2025年09月12日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出IncGridDBC算法,针对DBSCAN在动态数据环境中全量计算效率低的问题,创新性地构建网格图结构(Grid Graph Structure),将对象级关系抽象为网格单元级连接,实现增量聚类更新。该方法在保证与DBSCAN完全一致聚类结果的前提下,显著降低计算成本,实验显示最高提速60倍,适用于物联网(IoT)与智能制造等实时分析场景。

  

Highlight

本研究提出的IncGridDBC(Incremental Density-Based Clustering with Grid Graph Structure)是一种面向流式数据的高效增量密度聚类方法。其核心创新在于构建了一种网格图结构,其中节点仅对应非空网格单元,边则基于网格单元间的邻接关系建立,直接与DBSCAN中的半径阈值ε对齐。这一结构将复杂的对象级距离计算简化为轻量级的网格单元操作,大幅提升聚类更新效率。

Proposed Method

IncGridDBC包含三个核心步骤:网格划分、网格图构建和聚类更新。网格划分阶段将数据空间划分为固定大小的网格单元,仅保留非空单元;网格图构建阶段基于单元间的空间邻接关系建立图结构,并定义全连接、部分连接和非连接三种边状态;聚类更新阶段通过局部遍历识别受新对象影响的网格单元,避免全局扫描,保证聚类结果与DBSCAN完全一致。

Performance Evaluation

在六个真实世界数据集(维度最高达78维)上的实验表明,IncGridDBC相比现有增量密度聚类方法最高可实现60倍的加速效果,同时保持与DBSCAN完全一致的聚类精度。该方法在高维数据环境下仍保持稳健性能,适用于物联网(IoT)和智能制造等实时动态场景。

Conclusion

IncGridDBC通过网格图结构实现了高效且精确的增量聚类,其确定性图抽象机制避免了传统图方法中的迭代优化过程。该方法为动态环境下的实时数据分析提供了可扩展、高效率的解决方案,未来可进一步拓展至分布式计算和异常检测等应用场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号