《Extreme Mechanics Letters》:Tracing Back Transient Information from Near-Stationary Random Data
编辑推荐:
研究提出一种基于福克-普朗克方程(FPE)的数据驱动方法,通过近稳态随机数据反演系统瞬态概率密度。方法利用FPE作为物理先验知识,建立方程并通过近稳态样本进行辨识求解。实验在一维线性系统、二维线性系统和范德波尔系统三个典型随机振动场景中验证,结果表明该方法能有效从短时近稳态数据中恢复瞬态统计特性。
陈曦|金晓玲|王勇|黄志龙
中国浙江省杭州浙江大学工程力学系,浙江省软机器与智能设备重点实验室,310027
摘要
回顾过去和预测未来同样重要,然而与预测相比,回溯过程远未得到应有的关注。随着扩散模型的飞速发展,回溯方法经历了彻底的复兴,尤其是在随机系统中。本研究旨在解决这一问题,即从接近稳态的随机数据中追踪瞬态信息。与扩散模型不同,我们关注的是统计信息而非样本信息,并且只需要接近稳态的样本片段进行识别,而不需要大量完整样本进行学习。这种数据驱动方法的核心思想是:嵌入福克-普朗克方程(作为先验物理知识),该方程描述了状态概率密度的演化过程,然后通过识别和求解该方程来追踪瞬态概率密度。通过三个典型示例验证了该方法的有效性,分别是:一维线性系统、二维线性系统和范德波尔系统。
引言
回顾过去和预测未来是科学的永恒主题,两者同样重要。然而,与预测相比,回溯过程远未得到应有的关注。这种情况至少部分归因于确定性系统的可逆性,这使得预测和回溯具有相同的难度或相同的易感性[1],[2]。然而,对于随机系统来说并非如此!随着时间的推移,无序度增加,许多重要信息会逐渐消失,甚至完全被抹去,这使得回溯过去变得极其困难[3],[4]。
关于随机系统的预测与回溯之间的关系,著名数学物理学家罗杰·彭罗斯曾有精辟的评论[5]:
“可以公平地说,这种‘混沌不可预测性’对‘回溯’的影响通常比对‘预测’正常未来方向演化的影响要大得多。”
例如,我们可以预测两个相邻物体之间的温度差异,但却无法追溯两个温度完全相同的物体之间的温度变化历史。
从现有信息中回溯随机系统的过去信息,有助于我们回顾性地构建动态系统并设计符合需求的系统。最近,扩散模型取得了飞速发展,这为回溯随机系统带来了重大进展,甚至推动了某些商业领域的创新[6],[7],[8],[9]。扩散模型通过大量真实样本进行训练,从而具备了回溯历史的能力。以一个典型的例子来说,利用扩散模型,我们可以从单个图像中恢复墨水在水中扩散的整个过程。毫无疑问,扩散模型是自然科学和数据科学领域的重要进展。
要回溯一个样本,即一个随机系统的全部信息,我们必须向这些模型提供大量完整样本[10],[11]。只有通过大量完整样本,这些模型才能逐渐以一种隐晦而微妙的方式学习到系统的本质特征。在科学和工业领域,我们通常关注的是统计信息而非样本信息[12],[13]。统计信息只是部分描述;因此,即使数据较少,也有可能对其进行回溯。
让我们回顾一下随机过程和随机微分方程的物理理论,以获得建立理论指导的数据驱动方法的灵感。众所周知,状态概率密度的演化由查普曼-柯尔莫哥洛夫(CKS)方程和福克-普朗克(FPK)方程描述[14],[15],[16]。前者是一个积分方程,后者是一个微分方程,两者都用于控制转移概率密度。如果这两个方程已知,我们可以通过结合初始条件来向前求解,以确定后续演变[17],[18],[19],[20],[21]。同样,我们也可以通过结合当前条件来反向求解,以确定过去的状态。根据这种方法,只要方程仍然有效,我们就可以回溯到任何早期状态。相比之下,作为微分方程的FPK方程更容易识别、求解和分析[22],[23],[24]。
如果我们要将某些知识嵌入随机系统中以回溯过去,FPK方程是最佳选择。本研究致力于建立一种理论指导的数据驱动方法,仅从接近稳态的随机数据中回溯瞬态概率密度。本文的结构如下:第2节详细介绍了该方法的所有细节,包括数据收集、方程识别和方程求解。第3节通过三个典型且具有代表性的数值示例展示了该方法的应用和有效性。第4节总结了研究结果、进行了讨论并进行了回顾。
章节摘录
问题描述与方法说明
在这里,我们再次强调我们的目标是從接近稳态的随机数据中回溯瞬态概率密度。我们所知道的信息,即我们的起点,是从随机动力系统中收集的接近稳态的随机数据。其他信息,包括瞬态信息、激励因素以及系统本身,都是完全未知的。这种数据驱动方法的核心思想是:嵌入福克-普朗克方程(作为先验物理知识),该方程描述了
在典型随机振动系统中的应用
三个受到外部高斯白噪声激励的代表性随机动力系统,即一维线性随机振动系统、二维线性系统和范德波尔系统,被用作数值示例来展示数据驱动方法的有效性和可行性。通过数据驱动方法得到的漂移系数、扩散系数以及瞬态概率密度,与使用其他方法得到的结果进行了对比
结论
本文提出了一种新颖的数据驱动方法,旨在从短期接近稳态数据中识别FPK方程,并回溯系统响应的瞬态概率密度。
该方法直接从接近稳态的数据开始,无需显式的动力学公式或代理模型。然后建立瞬态和稳态概率密度的FPK方程,两者之间的差异突显了系统的非稳态特性
CRediT作者贡献声明
黄志龙:撰写——审稿与编辑、方法论、资金获取、形式分析。王勇:撰写——审稿与编辑、调查、形式分析、概念化。陈曦:撰写——初稿撰写、可视化、验证、软件开发、方法论、数据整理。金晓玲:撰写——审稿与编辑、验证、监督、资金获取、形式分析。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文的研究结果。
致谢
本研究得到了国家自然科学基金(项目编号12372036、12372035和12132013)的支持。此外,本研究是在第一作者访问加州大学伯克利分校期间完成的。衷心感谢伯克利分校提供的资源和指导。