基于信息粒化的时间序列模糊聚类分割方法研究

【字体: 时间:2025年06月21日 来源:Journal of Information and Intelligence

编辑推荐:

  本研究针对传统时间序列分割方法易受噪声和异常值干扰的问题,提出了一种基于信息粒化(Information Granulation)的动态时间规整(DTW)模糊聚类算法。通过结合合理粒化原则(Principle of Justifiable Granularity)和立方样条动态时间规整平均(CDTW)技术,实现了对长时序数据的高效分割。实验表明,该方法在分割精度和执行时间上均优于现有方法,为金融工程、环境监测等领域的时序分析提供了新思路。

  

时间序列分析是理解复杂系统动态特征的关键工具,但在实际应用中,传统分割方法面临噪声敏感、计算效率低等挑战。尤其当处理金融波动监测、气象数据预测等长时序任务时,现有基于全序列或连续子集的方法容易因极端值产生错误分割点,且难以捕捉远距离数据点的相关性。

为突破这些限制,研究人员开发了一种融合信息粒化技术的模糊聚类分割方法。该研究创新性地将合理粒化原则(Principle of Justifiable Granularity)引入动态时间规整(Dynamic Time Warping, DTW)框架,通过提取代表性数据点而非全部数据点进行运算。具体采用区间信息粒(Interval Information Granule)表征时序特征,利用立方样条动态时间规整平均(Cubic-spline DTW Averaging, CDTW)计算聚类中心,最终通过模糊C均值(FCM)算法实现分割优化。

关键技术包括:1)基于合理粒化原则的时序表征,通过Ω=[a,b]区间粒筛选代表性样本;2)改进的CDTW平均计算,结合权重因子wx/wy实现多序列融合;3)四阶段分割框架(初始化→中心更新→分割优化→相邻段合并),采用动态规划优化目标函数。实验使用合成数据和真实数据集(如尼罗河年径流量、波多黎各风速多变量序列)验证性能。

研究结果:

  1. 合成数据验证:在含高斯噪声(μ=0, σ=1.5)的模拟序列中,准确识别预设的6个变化段(t=[0,15,35,47,67,80,100]),聚类结果与真实分段一致。
  2. 多变量时序分析:对三变量合成数据(n=500)的分割结果与mGG算法、Hotelling T2检验等方法相当,但执行时间缩短40%。
  3. 真实数据应用:在尼罗河径流量(1871-1970年)分割中,得到[1871,1898,1970]的关键转折点,与动态规划方法[1871,1897,1970]高度吻合。
  4. 性能指标:在风速多变量数据上,Calinski-Harabasz指数(450)和Davies-Bouldin指数(10.91)显示该方法在聚类紧密度和分离度间取得平衡。

结论表明,该方法通过信息粒化有效抑制了噪声干扰,其"代表点优先"策略显著提升了长时序处理效率。未来可通过参数α(控制粒化特异性)和Nmax(最大分段长)的自适应优化进一步提升性能。该成果为处理非平稳、含噪时序数据提供了新范式,在工业过程监控、生态变化检测等领域具有应用潜力。论文发表于《Journal of Information and Intelligence》,为时序分析领域的方法创新提供了重要参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号