基于混合损失函数的随机微分方程系数函数推断研究:突破与进展

【字体: 时间:2025年03月03日 来源:npj Systems Biology and Applications 3.5

编辑推荐:

  为解决从数据中推断随机微分方程(SDEs)系数函数的难题,研究人员提出新目标函数,显著提升性能,意义重大。

  # 从数据中 “解锁” 随机微分方程的奥秘:新方法带来新突破
在生命科学和众多领域中,许多复杂的过程都像是隐藏在迷雾背后的神秘宝藏,等待着科学家们去探索和发现。随机微分方程(SDEs)作为描述连续时间动态系统的有力工具,在刻画复杂生物和自然过程方面发挥着重要作用。它就像是一个桥梁,连接了微观和宏观层面的建模,既能捕捉到个体的变异性,又在计算上具有一定的可行性,因此在生物建模、工程、流行病学和金融等领域都备受青睐。
然而,目前从数据中恢复 SDEs 系数函数的研究却面临着重重挑战。尽管参数 SDE 推断已经有了较为深入的发展,但在不假设解析结构的情况下,从数据中准确恢复系数函数的研究却少之又少。以往的研究大致分为两类,一类是将时间序列数据视为生成神经网络的实现,以实现从微分方程系统中采样;另一类则是利用神经网络填充预定义动态系统中的未知元素,但针对 SDEs 的相关研究还十分有限。

为了攻克这些难题,来自 [未提及具体研究机构] 的研究人员开展了一项极具意义的研究。他们提出了一种全新的优化目标函数,将基于模拟的惩罚与伪似然相结合,旨在提升 SDEs 系数函数推断的性能。该研究成果发表在《npj Systems Biology and Applications》上,为相关领域的发展带来了新的曙光。

研究人员在研究过程中运用了多种关键技术方法。首先,他们采用神经网络来表示 SDEs 的未知系数函数。在损失函数的构建上,综合运用了多种策略。例如,使用 Wasserstein 距离来衡量观察样本和重新生成样本的经验分布差异;引入负对数伪似然,基于 Lie - Trotter 分裂方案进行计算;同时考虑样本的自相关性,通过设置自相关性匹配损失来优化模型。此外,研究人员还通过实验评估了不同方法的性能,使用了包括直接系数重建、重新采样质量评估等多种指标,并对多个合成数据集和真实生物数据集进行分析。

结合模拟和伪似然目标的灵活混合公式


研究人员提出了用于表示系数函数的神经网络的 “Hybrid Lie - Trotter” 损失。该损失由三部分组成:一是观察样本和重新生成样本的经验分布之间的 Wasserstein 距离;二是给定模型下观察样本路径的负对数伪似然;三是观察样本和重新生成样本的经验自相关性之间的差异。通过这种混合损失函数,研究人员期望能够综合模拟损失和伪似然损失的优势,克服各自的不足。

混合损失函数在系数重建方面表现卓越


为了评估模型准确推断路径漂移和扩散系数的能力,研究人员计算了模型预测与真实值之间的期望 L2误差。结果发现,所提出的混合损失函数在系数重建方面表现显著优于当前最先进的矩匹配方法。在不同损失项组合的研究中,混合方案在所有情况下都优于单独基于伪似然或单独基于模拟的损失。虽然在评估扩散系数估计结果时难度较大,但混合方案的性能始终与最佳模型相近。

新方法生成的样本准确性更高


在从解分布生成样本的问题上,研究人员进行了实验。他们使用真实或估计的动力学、相同的初始条件和驱动布朗运动样本路径生成样本路径,并计算 L2误差。结果表明,混合方案的表现优于单个损失,尤其是优于矩匹配方法。在与 SDE - GAN 方法的比较中,基于深度 5 签名特征变换后的最大平均差异(MMD)度量,所提出的损失函数在所有情况下都优于 SDE - GAN 方法。

模拟时间对计算成本影响重大


研究人员还评估了不同方法的运行时间。结果发现,作为损失函数评估一部分生成合成样本的方法在训练时计算成本最高。与 Euler - Maruyama 伪似然相比,Lie - Trotter 方案中计算二阶导数会产生额外开销,但与模拟开销相比,其幅度较小。虽然无法直接与 SDE - GAN 方法进行运行时间比较,但研究人员通过实验发现,SDE - GAN 训练在计算上要密集得多,100 个训练周期在 GPU 节点上大约需要 68 小时,而其他模型在消费级 CPU 上训练不到两小时。

研究人员提出的结合模拟和伪似然策略的新目标函数,在 SDEs 系数函数推断方面取得了显著进展。通过实验验证,这种方法在系数重建和样本生成准确性上均优于当前的先进方法,为从数据中准确推断 SDEs 系数函数提供了更有效的途径。

然而,研究也存在一些需要进一步探索的方向。例如,在利用该系统获取生物学见解方面,还需要进行符号回归以识别数据背后的分析结构。目前在复杂问题上,相关力学识别还不可靠,需要进一步研究。此外,对估计系数函数进行不确定性量化也具有重要价值,虽然研究人员尝试使用贝叶斯神经网络但尚未取得一致稳健的拟合结果。在数据稀疏性方面,也需要探索更多的适应性策略。总体而言,该研究为随机动力学发现提供了重要的一步,为后续研究奠定了坚实的基础,有望推动相关领域在未来取得更多的突破和发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号