跨尺度图像-varifold技术xIV-LDDMM工具包:实现三维图像与空间组学的多模态映射

《Communications Biology》:The xIV-LDDMM toolkit of image-varifold based technologies for mapping 3D images and spatial-omics across scales

【字体: 时间:2025年10月02日 来源:Communications Biology 5.1

编辑推荐:

  研究人员针对空间组学数据跨尺度整合难题,开发了xIV-LDDMM工具包。该技术通过图像-varifold测度范数实现组织尺度图谱与分子/细胞尺度数据的映射,包含数据删失建模、尺度空间优化重采样和互信息特征选择三大模块,成功解决了部分体积匹配、数据复杂度优化和特征筛选问题,为多模态空间数据整合提供了统一数学框架。

  
随着成像技术和分子生物学方法的飞速发展,科学家们能够获取亚细胞精度的海量数据。然而,不同技术平台在测量特征、分辨率和物理捕获范围上的巨大差异,给多尺度数据整合带来了严峻挑战。特别是在三维空间中,如何将纳米级的分子数据与毫米级的组织图谱对齐,成为空间组学领域的关键难题。《Communications Biology》最新发表的这项研究,正是为了解决这一多尺度映射问题而展开的系统性攻关。
研究人员开发了一套名为xIV-LDDMM(cross-modality image-varifold LDDMM)的技术工具包,其核心是基于图像-varifold测度表示法,通过微分同胚变换建立不同尺度数据间的对应关系。该研究主要采用了三大关键技术:针对部分体积匹配问题的显式删失数据表示法、基于多尺度空间优化的重采样网格生成技术,以及基于互信息的功能特征选择方法。这些技术被整合到跨模态映射算法中,使用图像-varifold测度范数来统一表示不同尺度和成像模态的数据。
研究使用了四种空间转录组数据集进行验证:覆盖小鼠大脑大部分区域的MERFISH数据集(56个冠状切片,约500个基因);新采集的BARseq全脑数据集(40个冠状切片,104个基因);已发表的BARseq半脑数据集(8个数据集各32个半脑切片);以及使用cycleHCR技术测量的全小鼠胚胎数据集(254个基因,310μm深度)。这些数据集代表了当前空间组学技术的典型应用场景。
通过varifold测度实现跨模态映射是研究的核心创新。该方法将分子和细胞尺度数据表示为离散粒子测度,每个粒子携带空间位置和条件概率分布。对于跨模态映射问题,研究人员假设图谱每个区域与一个在分子/细胞特征空间上的概率定律相关联,通过最小化varifold范数距离来同时估计微分同胚变换和特征分布。
映射全脑到部分体积删失目标时,研究引入了空间删失函数来限制变形图谱的匹配范围。这种方法特别适用于处理只覆盖大脑部分区域的空间组学数据,如半脑冠状切片。通过超双曲正切函数或UNET网络估计的支持权重,能够准确区分测量区域和未测量区域。
尺度空间重采样技术解决了海量数据的计算复杂度问题。研究人员通过优化粒子近似方法,在固定的复杂度下生成最接近目标大脑的粒子表示。与传统的K均值聚类或网格重采样方法相比,这种基于varifold范数的优化方法能够同时考虑物理空间和特征空间的邻近性,更好地保持数据的生物学意义。
基于互信息的特征选择则针对转录组测量的复杂性提供了解决方案。该方法通过评估基因在空间上的变异程度,选择那些最能区分不同组织区域的特征。研究发现,高互信息得分的基因(如Gfap、Trp53i11、Wipf3)在区分不同脑区方面表现显著优于低得分基因,这与组织图谱的区域划分高度一致。
在BARseq数据映射到CCFv3图谱的验证中,研究显示皮质层的对齐准确率达到了70-80%,错误对齐的细胞平均距离正确区域仅约50μm。与手动切片对齐相比,xIV-LDDMM在深层皮质层(5和6层)的对齐准确率更高。
研究还展示了该技术在非脑组织中的应用,成功将EMAP小鼠胚胎图谱映射到cycleHCR测量的全小鼠胚胎数据。尽管胚胎发育存在时间变异,该方法仍能实现准确对齐, primitive streak和parietal endoderm区域的平均距离减少了4.5倍。
计算复杂度分析表明,虽然该方法需要处理二次计算复杂度的内核运算,但通过尺度空间重采样能够有效降低计算负担。在不同尺度(50μm、100μm、200μm)的近似表示中,估计的微分同胚变换保持一致,证明了尺度空间重采样方案的可靠性。
该研究的重要意义在于提供了一套统一的数学框架来解决多尺度空间组学数据整合的核心难题。通过图像-varifold表示法和相应的算法技术,研究人员能够将纳米级的分子测量与毫米级的组织图谱无缝连接,为理解生物系统的多尺度组织原理提供了强大工具。这种方法不仅适用于大脑研究,还能推广到其他组织器官和发育阶段的研究中,有望成为空间组学数据标准化和整合分析的基础技术。
研究开发的xIV-LDDMM工具包通过创新的数学框架和计算技术,成功解决了多尺度空间组学数据整合的关键难题,为跨模态数据融合和生物系统多尺度理解提供了强有力的技术支持。随着空间组学技术的不断发展,这种方法将在生物医学研究中发挥越来越重要的作用。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号