动态薛定谔问题的大偏差理论:从薛定谔桥到最优传输的指数收敛性分析
《Journal of Applied Probability》:Large deviations for dynamical Schr?dinger problems
【字体:
大
中
小
】
时间:2025年12月10日
来源:Journal of Applied Probability 0.7
编辑推荐:
本文聚焦于动态薛定谔问题在噪声趋于零时的渐近行为。研究者们针对由扰动布朗运动驱动的薛定谔桥,建立了其大偏差原理(LDP),揭示了薛定谔桥在极限最优传输(OT)解支撑集之外的区域具有指数小的概率质量。该研究通过利用薛定谔桥的混合表示以及布朗桥的指数连续性,为理解动态薛定谔问题与动态蒙日-坎托罗维奇最优传输问题之间的深层联系提供了严格的数学基础,对概率论和最优传输领域具有重要意义。
在概率论、最优传输(Optimal Transport, OT)以及机器学习的交叉领域,动态薛定谔问题(Dynamical Schr?dinger Problem)近年来受到了广泛关注。该问题旨在寻找一个参考路径测度(如维纳测度)在给定初始和终端分布约束下的熵投影(Entropic Projection)。这个源于物理学的古老问题,如今在统计学、机器学习和大规模数据分析中展现出强大的应用潜力,特别是其静态版本等价于二次熵最优传输(Entropic Optimal Transport, EOT),可通过Sinkhorn算法进行高效计算。然而,一个核心的理论问题是:当驱动薛定谔问题的噪声水平趋于零时,其最优解(称为薛定谔桥,Schr?dinger Bridge)如何收敛到经典的最优传输问题的解?这种收敛的局部速率又是怎样的?理解这种极限行为对于评估EOT作为OT的“正则化”近似的精度至关重要,也关系到基于薛定谔桥的生成模型等应用的可靠性。先前的研究,如Mikami和Léonard的工作,已经确立了薛定谔桥到最优传输解的弱收敛性,但收敛的局部速率,即解在极限支撑集之外的“质量”衰减速度,仍然是一个悬而未决的问题。
为了回答这个问题,发表在《Journal of Applied Probability》上的这项工作,由康奈尔大学的Kengo Kato完成,首次为动态薛定谔问题建立了完整的大偏差原理。研究结果表明,当噪声水平ε趋于零时,薛定谔桥在极限最优传输路径支撑集之外的概率质量呈指数级衰减,其衰减速率由一个明确的速率函数(Rate Function)所控制。该速率函数与最优传输的康托罗维奇势(Kantorovich Potential)密切相关,清晰地刻画了薛定谔桥围绕其极限行为的涨落。
研究者们为开展这项研究,主要运用了几个关键的数学技术方法。首先,他们利用了薛定谔桥的两种基本表示形式:一种是作为最优传输计划(EOT plan)与布朗桥(Brownian Bridge)的混合;另一种是作为初始-终端分布混合的布朗桥的指数倾斜(Exponential Tilting)。其次,研究的核心是建立了布朗桥关于其初始和终端点的“指数连续性”(Exponential Continuity),即当端点随噪声参数变化时,相应的布朗桥测度满足一致的大偏差估计。最后,他们结合了静态熵最优传输问题中关于最优传输计划和势函数收敛性的已有结果,通过精细的概率分析和变分技巧,最终推导出路径空间上的大偏差原理。在边际分布具有紧支撑的假设下,他们还利用类似Varadhan引理的方法给出了一个更直接的证明,该方法可推广到以朗之万扩散(Langevin Diffusion)为参考测度的更一般情形。
在标准假设下(终端分布μ1关于勒贝格测度绝对连续且具有有限相对熵),研究首先回顾并补充证明了薛定谔桥Pε随着噪声水平ε趋于零时,会弱收敛到极限路径测度Po。这个极限测度Po是经典动态蒙日-坎托罗维奇最优传输问题的解,其路径是连接初始点和终端点的直线(测地线),即σxy(t) = (1-t)x + ty,其中端点对(x, y)服从最优传输计划πo。Po的支撑集恰好是由所有这些直线路径构成的集合Σπo。这为后续研究大偏差(即收敛速率)提供了基准。
这是本项研究的关键技术基石。研究者们证明了布朗桥测度族{Rε, z}(其中z=(x,y)为端点)在端点z随ε变化而收敛到某个极限点时,满足一致的大偏差原理。具体而言,对于任意收敛到z的点列{zk},对应的布朗桥测度序列{Rεk, zk}满足大偏差原理的上界和下界估计,且速率函数为Jz(h) = ‖h‖H2/2 - c(x, y) + ι{(x,y)}((h(0), h(1)))。这里‖h‖H2/2 = (1/2)∫01|?(t)|2dt是路径h的能量,c(x, y) = |x-y|2/2是成本函数。这个性质的证明没有采用传统的转移密度估计方法,而是基于抽象维纳空间(Abstract Wiener Space)的理论,特别是卡梅隆-马丁公式(Cameron-Martin Formula)和费尔尼克定理(Fernique‘s Theorem),从而保证了估计的一致性。
基于布朗桥的指数连续性和静态EOT问题的大偏差结果,研究者们建立了薛定谔桥Pε的大偏差原理。主要结果分为两种情形:
- •弱型大偏差原理:在相对一般的条件下(包括边际分布支撑无界,但要求最优传输势唯一),证明了对于任意趋于零的序列εk,薛定谔桥序列{Pεk}满足一个“弱型”大偏差原理。这意味着,对于满足特定条件的开集和闭集,概率的对数渐近行为由速率函数I(h)控制。该速率函数被明确给出:I(h) = ‖h‖H2/2 - ψc(h(0)) - ψ(h(1)),其中ψ是从μ1到μ0的最优传输势,ψc是其c-变换。该函数在极限路径集Σπo上为零,而在其外为正,精确地量化了薛定谔桥偏离极限行为的“代价”。
- •完全大偏差原理:当初始和终端分布的支撑集是紧集,并且其中一个支撑集是某个连通开集的闭包时(此条件用于保证最优传输势的唯一性和连续性),研究者们证明了一个完全的大偏差原理,即速率函数I是好的速率函数(具有紧的水平集),且大偏差上界对所有闭集成立。此外,他们还提供了一个替代的、更直接的证明,该证明利用了薛定谔桥作为指数倾斜测度的表示以及EOT势函数的一致收敛性。
- •两点边际的大偏差:通过收缩原理(Contraction Principle),研究者们推导出薛定谔桥在任意两个时间点s和t的联合分布Pstε的大偏差原理,并给出了其速率函数的显式表达式,该表达式与Hopf-Lax半群相关联的中间时间的最优传输势有关。
- •福尔默过程:当初始分布μ0是狄拉克测度时,薛定谔桥退化为(扰动的)福尔默过程(F?llmer Process)。在此特例下,速率函数有更简洁的形式。
- •朗之万扩散参考测度:研究者们将主要结果推广到参考测度为朗之万扩散(Langevin Diffusion)的情形。他们证明了,在适当的正则性条件下,相应的薛定谔桥也满足具有相同速率函数I的大偏差原理。证明的关键在于建立了朗之万桥的指数连续性,这通过计算朗之万桥相对于布朗桥的拉东-尼科迪姆导数(Radon-Nikodym Derivative)并利用瓦拉丹渐近(Varadhan Asymptotics)得以实现。
这项研究首次为动态薛定谔问题建立了大偏差原理,从根本上揭示了薛定谔桥在微小噪声扰动下的渐近概率行为。其核心结论是,薛定谔桥以指数级的速度将其质量集中在经典最优传输问题的解(即测地路径)的周围。这意味着,对于很小的噪声水平ε,观察到一条显著偏离最优传输路径的轨迹的概率是超乎想象的小,大约为exp(-C/ε)量级,其中常数C由速率函数在偏离路径上的下确界决定。
这项工作的意义重大而深远。在理论层面,它深化了我们对薛定谔问题作为蒙日-坎托罗维奇最优传输问题的“噪声扰动”版本这一本质联系的理解,将原先的弱收敛结果推进到了更精细的大偏差层面。所发展的技术,特别是关于布朗桥和朗之万桥的指数连续性分析,为研究路径空间上更复杂的随机过程的大偏差提供了新工具。在应用层面,该研究为基于熵正则化的最优传输方法提供了理论保证。在统计学和机器学习中,熵最优传输因其计算效率而备受青睐,但通常会引入偏差。本工作定量地刻画了这种偏差随正则化参数减小而消失的速率,有助于在实际应用中对计算效率和精度进行权衡。此外,薛定谔桥近年来在生成建模中显示出潜力,这项工作为其采样路径的集中性提供了严格的理论解释。
总之,Kengo Kato的这项研究解决了概率论和最优传输理论中的一个基础性问题,其严谨的证明和广泛的应用前景使其成为该领域的一项重要进展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号