
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于高斯混合模型驱动的物理系统数据可解释建模、聚类与预测方法研究
【字体: 大 中 小 】 时间:2025年08月24日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文提出了一种基于高斯混合模型(GMM)的物理系统数据可解释建模、聚类与预测方法,通过自适应确定GMM成分数(K值)和多元GMM驱动的时序预测算法,实现了对离散数据与时间序列数据的参数化建模与预测。其创新性在于将GMM的建模能力拓展至预测领域,在保持可解释性的同时接近深度神经网络(DNN)的预测性能(实验数据相关系数达0.9542 vs 0.9686),为物理系统科学计算提供了兼具统计意义与工程价值的AI工具。
Highlight
聚焦物理系统科学计算的可解释性需求,本研究通过高斯混合模型(GMM)驱动的方法体系,实现了从数据建模、聚类到时序预测的全流程创新。
GMM estimation by EM algorithm
当d维特征数据x服从K个高斯混合分布时,其概率密度函数可表示为:
p(x)=∑k=1KPkN(x|μk,∑k)。
其中混合权重Pk需满足∑k=1KPk=1的约束条件,该框架为后续自适应确定K值算法奠定了理论基础。
Real measurement data from physical system
采用两组真实物理系统数据集验证方法有效性:
数据集1:中国江苏某高速公路车辆总质量与轴重的离散数据
数据集2:千米级悬索桥现场风速风向时序数据
Discussion
研究发现:当GMM成分数K接近真实值Kt时,频率直方图分箱高度与GMM函数的均方根误差(RMSE)会呈现显著拐点。这一现象为无监督场景下自适应确定最优K值提供了量化依据。
Conclusion
本研究提出的GMM驱动方法体系具有两大突破:
基于频率直方图辅助的GMM成分数自适应确定技术
面向多输入单输出(MISO)系统的多元GMM时序预测算法
在桥梁工程实测数据验证中,该方法在保持参数可解释性的同时,预测性能逼近黑箱模型DNN,为物理系统数字孪生提供了新的科学计算工具。
生物通微信公众号
知名企业招聘