CELLECT:基于对比嵌入学习的大规模高效细胞追踪方法
《Nature Methods》:CELLECT: contrastive embedding learning for large-scale efficient cell tracking
【字体:
大
中
小
】
时间:2025年10月21日
来源:Nature Methods 32.1
编辑推荐:
本刊推荐:研究人员针对大规模细胞行为定量分析中高性能与高效率难以兼顾的挑战,开发了基于对比嵌入学习的CELLECT方法。该方法通过稀疏标注即可实现跨物种、跨成像模态的精准3D细胞追踪,处理速度较现有方法提升50倍以上,在免疫学、病理学和神经科学领域展现出广泛应用前景。
在生命科学研究领域,定量分析大规模细胞行为对于理解多种生理病理过程机制具有日益重要的作用。随着光学成像技术的飞速发展,科学家们已经能够以高时空分辨率对生物组织进行长期活体观测,从而在天然三维环境中可视化细胞间活动。然而,更长的成像时长和更宽的视野产生了海量数据,超出了人工处理能力。从太字节甚至拍字节级别的成像数据中提取高维有价值信息,对下游分析算法提出了高性能和高效率的迫切需求。
基于深度学习的细胞追踪算法近年来在追踪精度方面取得了显著成功,但在复杂数据集中的应用仍受限,这些方法通常需要大量人工标注进行模型训练,包括细胞位置、形状和轨迹等细节。虽然近期提出的基于稀疏标注的追踪算法减轻了标注负担,但其依赖固定长度时间窗口进行全局轨迹优化引入了高计算成本和对时间采样的严格要求,限制了实时性能。因此,在复杂动态3D环境中实现大规模细胞精准追踪的同时保持高效率,仍是当前细胞追踪算法需要填补的空白。
针对这一挑战,清华大学戴琼海教授和吴嘉敏副教授团队在《Nature Methods》上发表了题为"CELLECT: contrastive embedding learning for large-scale efficient cell tracking"的研究成果。他们开发了一种名为CELLECT的对比嵌入学习方法,旨在实现复杂环境下大规模细胞的实时3D追踪。
CELLECT的核心创新在于采用对比学习框架来学习多样细胞结构的潜在嵌入表示,而非像传统方法那样直接使用3D空间域中的显式强度分布进行分割和定位。研究人员首先利用公开数据集中的稀疏标注细胞,通过对比学习最大化不同细胞之间的差异,从而获得更好的识别能力。随后,分割和追踪过程可以在潜在嵌入空间中进行,兼具高保真度和低计算成本,无需进一步调整。
为了验证CELLECT的优势,研究团队首先在广泛接受的细胞追踪挑战赛上进行了定量基准测试。他们使用了两种公开的秀丽隐杆线虫胚胎发育数据集,这些是通过共聚焦显微镜和光片显微镜捕获的3D延时数据,仅包含稀疏标注。与包括linajea、Imaris和StarryNite在内的先进追踪算法相比,CELLECT在两种数据集上都显示出显著更低的错误率,并在细胞追踪挑战赛的Fluo-N3DH-CE数据集上获得了追踪和分割任务的双料冠军。
在追踪精度方面,CELLECT在mskcc-confocal数据集上达到了46%的追踪准确度,是linajea(22%)的两倍多,也超过了升级版的linajea+csc+sSVM(30%)。更令人印象深刻的是,CELLECT的计算成本远低于linajea及其变体。在使用单个NVIDIA GTX 3090图形处理单元的测试中,CELLECT达到了每帧2秒的平均处理速度(针对体积大小为512×512×41体素的数据集),比linajea(111.3秒/帧)快56倍。
CELLECT的技术方法主要包括以下几个关键组成部分:采用3D U-Net架构作为主干网络,使用两个相邻帧作为输入;开发中心增强网络来生成细胞中心的3D掩码;设计帧内多层感知机和帧间多层感知机模型来识别和移除冗余细胞中心,并确定细胞间的关联关系。通过对比学习优化潜在嵌入,轻量级的网络结构足以让两个MLP实现高效准确的3D细胞追踪。
在免疫学应用方面,研究团队将CELLECT与他们最近开发的2pSAM(双光子合成孔径显微镜)方法结合,长期追踪小鼠生发中心中密集T细胞和B细胞的快速动态。这些太字节级别的数据集能够全面评估CELLECT处理高度动态、密集细胞群体的高效能力。
为了在密集T细胞追踪中获得地面真实值,研究人员使用了转基因小鼠,其中DsRed标记和绿色荧光蛋白标记的OT-II T细胞以1:5的比例存在。2pSAM的低光毒性使他们能够以高速连续对小鼠淋巴结进行3D成像超过5小时。选择性DsRed标记的细胞相对更容易被CELLECT和Imaris在3D中追踪,因此它们被用作密集细胞追踪任务的地面真实值。
结果显示,CELLECT在密集细胞通道中保持了91.5%的追踪准确度,显著高于Imaris的70.7%。CELLECT能够对T细胞进行超过30分钟的长期稳定追踪,产生更平滑、更长的轨迹。相比之下,Imaris表现出碎片化的运动轨迹,反映了其在密集区域中的局限性。
研究人员进一步将CELLECT应用于生发中心形成过程中大规模B细胞的长期追踪。生发中心是免疫反应期间B细胞增殖和迁移的关键场所,这些密集 populated 的环境对自动追踪方法构成了重大挑战,特别是由于在此过程中存在大量细胞分裂。使用在mskcc-confocal数据集上预训练的CELLECT模型,研究人员直接将其应用于通过2pSAM捕获的生发中心数据集,无需重新训练。
CELLECT成功追踪了成像区域内持续超过5分钟的7,000多个细胞,并识别了细胞分裂事件,可视化其时空分布,揭示了生发中心区域内丰富的分裂活动,这是Imaris无法检测到的。重要的是,CELLECT在有丝分裂期间持续重建连续的细胞轨迹,而Imaris将其识别为两个新细胞。
在计算效率方面,CELLECT表现出卓越的可扩展性。处理这个260GB的数据集,CELLECT仅需157分钟,而Imaris需要480分钟(包括180分钟的数据转换时间)。CELLECT的轻量级架构使其能够在仅4GB RAM的标准笔记本电脑上运行,而Imaris需要近100GB内存。
在细胞相互作用分析方面,研究团队进行了小鼠脾脏内细菌、中性粒细胞和巨噬细胞的多通道活体成像。将荧光标记的细菌静脉注射到小鼠体内,使用2pSAM连续进行脾脏的三通道体积成像超过4小时。预训练的CELLECT模型直接应用于追踪细菌和免疫细胞,无需重新训练。
CELLECT实现了细菌和免疫细胞轨迹的同时提取以及准确的细胞分割。通过可靠的细胞和细菌分割与追踪,CELLECT支持基于细胞与细菌之间3D空间共定位的细菌吞噬状态事件的自动分类。分析揭示了不同的免疫策略:中性粒细胞倾向于追逐活动的细菌,而巨噬细胞捕获被动运输的细菌。总体而言,巨噬细胞在脾脏中吞噬了更多细菌,这可能归因于其更高的密度或更宽的捕获半径。
在神经科学应用方面,研究团队通过观察果蝇脑组织变形过程中活跃放电的神经元来测试CELLECT方法,评估其与常规追踪软件(如Imaris或TrackMate)相比的功效。他们对表达GCaMP6s的果蝇大脑大范围区域进行了高时空分辨率成像,持续时间约100分钟。
在组织变形强烈的条件下,CELLECT成功追踪并获得了可靠钙活动信号。与Imaris或TrackMate相比,CELLECT的追踪准确度高出三倍以上。即使神经元处于非活动状态,CELLECT也显示出更长的追踪持续时间和基线波动的一致性,这些优势在高度动态环境中实现了神经活动的稳健钙信号提取。
研究还进行了消融研究和可重复性测试,以表征CELLECT中每个模块的功能和参数配置。中心增强网络模块通过集中细胞中心周围的值并抑制外周噪声来细化置信度图,确保在嘈杂环境或复杂组织结构中的精确预测。搜索掩模大小的选择显著影响性能,5×5×3搜索掩模实现了最佳平衡。级别配置在中心增强网络性能中也起着关键作用,包含从1到4的所有级别保持了稳健的置信度分布并确保精确的中心定位。
CELLECT的另一个优势是其时间链接的灵活性。即使仅在原始帧速率的数据集上训练,CELLECT在较长间隔(如从帧t到t+2或t+3链接)仍能保持稳定的追踪性能。对于成像帧速率较低的条件,纳入多时间训练样本和增加空间候选者数量通过减少拥挤、活跃分裂区域中的假阴性来提高鲁棒性。
虽然CELLECT不依赖密集分割掩模,但它基于稀疏中心点标注提供粗略分割和半径估计。模型通过学习实例特定的空间嵌入,最小化细胞内距离并最大化局部邻域内细胞间距离,即使在缺乏边界级监督的情况下也能产生围绕中心点的柔软但生物学一致的分割图。
研究人员指出,CELLECT目前仅使用两个时间相邻帧作为输入以最大化效率,这限制了其捕捉长期时间关系的能力。当细胞间运动、碰撞或细胞分裂等关键事件发生在帧之间时,追踪精度可能仍然会下降。未来的扩展可能会纳入运动先验、全局优化或轨迹建模以提高帧间时间一致性。另一个限制在于CELLECT的基于斑块处理:当靶细胞明显大于训练期间所见并占据大部分斑块时,模型可能产生更多冗余检测并增加链接错误风险。
尽管如此,随着成像技术的快速进步,科学家现在能够跨整个器官和延长时间实现对大规模细胞的高速3D活体观察。这些仪器为不同病理和生理状态期间的细胞间和细胞内相互作用提供了直接可视化,而CELLECT填补了分析此类高通量数据集的空白,这对于定量理解生命系统中跨多个尺度的基本物理过程至关重要。
该研究通过高效提取定量细胞动力学的各个方面,包括分裂事件、谱系身份、细胞间相互作用、运动性、增殖动力学和对环境变化的响应,相信CELLECT将推动发育生物学、病理学、免疫学、神经科学和药理学等不同领域的广泛发现。
总结而言,CELLECT通过创新的对比嵌入学习框架,解决了大规模细胞追踪中精度与效率难以兼顾的关键挑战。该方法仅需稀疏标注即可实现跨物种、跨成像模态的精准3D追踪,处理速度比现有方法快50倍以上,在免疫反应、细胞-病原体相互作用和神经活动记录等复杂生物过程中展现出卓越性能。随着成像技术向更高通量发展,CELLECT为大规模定量生物学研究提供了强有力的分析工具,有望在多个生命科学领域产生深远影响。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号