基于Wasserstein-1神经最优传输的快速可扩展单细胞扰动预测新方法

【字体: 时间:2025年07月16日 来源:Bioinformatics 4.4

编辑推荐:

  本研究针对单细胞扰动预测中传统Wasserstein-2(W2)最优传输(OT)求解器存在的计算复杂度高、收敛慢等问题,开发了基于Wasserstein-1(W1)对偶公式的新型神经OT求解器。通过1-Lipschitz群排序网络与对抗训练相结合,实现了25-45倍加速,在保持"单调性"映射特性的同时,在sciplex3和4i等单细胞数据集上达到或超越W2 OT性能,为高通量单细胞数据分析提供了高效工具。

  

在生命科学领域,单细胞扰动实验已成为研究细胞对环境变化(如药物治疗)响应的重要工具。然而,由于测量过程中细胞的固定或破坏,研究人员只能获得未配对的控制组和扰动组单细胞数据分布,这给建立准确的预测模型带来了巨大挑战。传统方法如scGen仅通过均值位移进行预测,难以捕捉复杂的分布变化;而基于Wasserstein-2(W2)最优传输的CellOT等方法虽然效果更好,却面临着复杂的极小-极大优化问题和输入凸神经网络(ICNN)在高维数据中的性能限制。

针对这些挑战,美国马里兰大学(University of Maryland)计算机科学系的Yanshuo Chen等研究人员在《Bioinformatics》发表研究,提出了一种创新的Wasserstein-1(W1)神经最优传输求解器。该方法通过简化对偶问题为单一1-Lipschitz函数的最大化问题,结合对抗训练确定传输步长,成功克服了传统方法的计算瓶颈,为单细胞数据分析提供了更高效的解决方案。

研究团队采用了三个关键技术方法:1) 使用GroupSort激活函数的1-Lipschitz神经网络求解W1对偶问题;2) 通过对抗训练学习样本特异性传输步长;3) 在sciplex3 scRNA-seq和4i细胞成像数据集上验证性能,比较了特征均值相关性(r2)、L2距离和最大均值差异(MMD)等指标。

研究结果部分显示,在"3.1 W1 OT solver learns the monotonic map on 2D datasets"中,通过设计的"书架"和"同心圆"等合成数据集验证,该方法能保持标记点的相对顺序,成功学习到符合生物学意义的"单调"映射。

"3.2 W1 OT solver accurately predicts single-cell responses"表明,在真实单细胞数据集上,该方法在i.i.d.设置中与W2 OT性能相当,显著优于scGen;在更具挑战性的o.o.d.(out-of-distribution)场景下,由于W1度量对噪声的鲁棒性,其表现甚至优于W2 OT。

"3.3 W1 OT solver scales better on high dimensional scRNA-seq datasets"部分显示,该方法在1000维高可变基因数据上仍保持良好性能,而W2 OT则显著下降;计算时间仅需5分钟,比传统方法快25-45倍。

这项研究的创新性在于将复杂的OT问题分解为两个更简单的优化任务:通过W1对偶获得传输方向指导,再通过对抗训练确定步长。这不仅解决了传统方法在高维数据中的性能瓶颈,还为单细胞分析领域提供了首个准确的W1 OT求解器。随着单细胞基础模型的发展,这种高效、可扩展的方法有望加速超大规模单细胞数据集的研究,在癌症研究、药物开发等领域产生重要影响。研究团队也指出,虽然经验证该方法能学习"单调"映射,但其理论保证仍是未来需要探索的方向。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号