基于高斯混合模型驱动的物理系统数据可解释建模、聚类与预测方法研究

【字体: 时间:2025年08月24日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本文提出了一种基于高斯混合模型(GMM)的物理系统数据可解释建模、聚类与预测方法,通过自适应确定GMM成分数(K值)和多元GMM驱动的时序预测算法,实现了对离散数据与时间序列数据的参数化建模与预测。其创新性在于将GMM的建模能力拓展至预测领域,在保持可解释性的同时接近深度神经网络(DNN)的预测性能(实验数据相关系数达0.9542 vs 0.9686),为物理系统科学计算提供了兼具统计意义与工程价值的AI工具。

  

Highlight

聚焦物理系统科学计算的可解释性需求,本研究通过高斯混合模型(GMM)驱动的方法体系,实现了从数据建模、聚类到时序预测的全流程创新。

GMM estimation by EM algorithm

当d维特征数据x服从K个高斯混合分布时,其概率密度函数可表示为:

p(x)=∑k=1KPkN(x|μk,∑k)。

其中混合权重Pk需满足∑k=1KPk=1的约束条件,该框架为后续自适应确定K值算法奠定了理论基础。

Real measurement data from physical system

采用两组真实物理系统数据集验证方法有效性:

  • 数据集1:中国江苏某高速公路车辆总质量与轴重的离散数据

  • 数据集2:千米级悬索桥现场风速风向时序数据

Discussion

研究发现:当GMM成分数K接近真实值Kt时,频率直方图分箱高度与GMM函数的均方根误差(RMSE)会呈现显著拐点。这一现象为无监督场景下自适应确定最优K值提供了量化依据。

Conclusion

本研究提出的GMM驱动方法体系具有两大突破:

  1. 1.

    基于频率直方图辅助的GMM成分数自适应确定技术

  2. 2.

    面向多输入单输出(MISO)系统的多元GMM时序预测算法

    在桥梁工程实测数据验证中,该方法在保持参数可解释性的同时,预测性能逼近黑箱模型DNN,为物理系统数字孪生提供了新的科学计算工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号