基于高斯混合模型驱动的物理系统数据可解释建模、聚类与预测方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月24日 来源：Engineering Applications of Artificial Intelligence 8

编辑推荐：

　　本文提出了一种基于高斯混合模型（GMM）的物理系统数据可解释建模、聚类与预测方法，通过自适应确定GMM成分数（K值）和多元GMM驱动的时序预测算法，实现了对离散数据与时间序列数据的参数化建模与预测。其创新性在于将GMM的建模能力拓展至预测领域，在保持可解释性的同时接近深度神经网络（DNN）的预测性能（实验数据相关系数达0.9542 vs 0.9686），为物理系统科学计算提供了兼具统计意义与工程价值的AI工具。

Highlight

聚焦物理系统科学计算的可解释性需求，本研究通过高斯混合模型（GMM）驱动的方法体系，实现了从数据建模、聚类到时序预测的全流程创新。

GMM estimation by EM algorithm

当d维特征数据x服从K个高斯混合分布时，其概率密度函数可表示为：

p(x)=∑_k=1^KP_kN(x|μ_k,∑_k)。

其中混合权重P_k需满足∑_k=1^KP_k=1的约束条件，该框架为后续自适应确定K值算法奠定了理论基础。

Real measurement data from physical system

采用两组真实物理系统数据集验证方法有效性：

•
数据集1：中国江苏某高速公路车辆总质量与轴重的离散数据
•
数据集2：千米级悬索桥现场风速风向时序数据

Discussion

研究发现：当GMM成分数K接近真实值K_t时，频率直方图分箱高度与GMM函数的均方根误差（RMSE）会呈现显著拐点。这一现象为无监督场景下自适应确定最优K值提供了量化依据。

Conclusion

本研究提出的GMM驱动方法体系具有两大突破：

1.
基于频率直方图辅助的GMM成分数自适应确定技术
2.
面向多输入单输出（MISO）系统的多元GMM时序预测算法
在桥梁工程实测数据验证中，该方法在保持参数可解释性的同时，预测性能逼近黑箱模型DNN，为物理系统数字孪生提供了新的科学计算工具。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号