编辑推荐:
为解决活细胞追踪难题,研究人员开发时间对称深度学习追踪法,在酵母细胞追踪表现出色,具重要意义。
在微观的生命科学研究领域,细胞就像一个个神秘的小宇宙,蕴含着无数的生命奥秘。而想要深入探索这些奥秘,精准追踪细胞的一举一动至关重要。尤其是在活细胞研究中,通过视频显微镜记录来准确追踪细胞,就如同在错综复杂的迷宫中找到正确的路径,难度极大。传统基于图像处理的目标追踪方法,就像用旧地图去探索新城市,在面对细胞时问题重重。细胞可不是 “乖宝宝”,它们会迅速且不可预测地改变形状,还会生长、分裂,行为复杂多变,这使得传统方法的局限性暴露无遗。
近年来,机器学习技术的兴起给细胞追踪带来了新希望,不少工具开始采用卷积神经网络(CNN)。然而,大多数工具仍依赖逐帧追踪,这种方式就像只看眼前一步路,忽视了大量有用信息。为了突破这一困境,来自匈牙利罗兰大学(ELTE)和意大利 FIRC 分子肿瘤学研究所(IFOM)的研究人员踏上了探索之旅,他们致力于开发一种全新的基于深度学习的细胞追踪方法,相关研究成果发表在《npj Systems Biology and Applications》上。
研究人员采用了多种关键技术方法。在实例分割阶段,利用基于 Mask R-CNN 的架构进行细胞实例分割。该方法借助 Detectron2 环境训练模型,并运用多种数据增强技术,让模型在细胞检测和形状识别上表现卓越。在追踪环节,提出一种新颖的多帧分配方法,基于时间对称的理念,利用局部时间邻域信息预测细胞位置,有效避免了对时间方向的依赖。这种方法通过神经网络对单个细胞进行局部追踪,再基于语义分割预测进行全局追踪,实现对细胞的完整追踪。此外,研究人员还利用合成数据集来测试模型的通用性。
研究结果如下:
- 比较工具评估:研究人员挑选 Phylocell 和 YeaZ 作为对比工具。通过计算 F 分数评估分割和追踪质量,结果显示,在去除边界轨迹(border tracks)的公平场景下,新方法在分割和追踪质量上远超其他两种工具。即便在预测结果未改变、存在数据差异的情况下,新方法依然表现出色12。
- 超参数依赖性:研究人员对影响追踪性能的超参数展开研究,发现较短的局部追踪范围和较低复杂度的模型骨干在分割结果稳定时表现稍好,因为训练更简单。而在检测或分割不完善时,较长的局部追踪范围更具优势。同时,使用交并比(IoU)作为全局一致性度量,在短期追踪中效果显著优于欧氏距离34。
- 追踪稳健性:通过进行消融研究,故意去除部分分割实例来模拟现实中的追踪挑战。结果表明,新方法能有效重建连续轨迹,对分割实例进行插值,提升分割和追踪的 F 分数。而且,较长的局部追踪范围在处理连续缺失的分割实例时表现更优,凸显了该方法的稳健性56。
- 比较数据集评估:在多种合成数据集上对酵母追踪架构进行训练和评估,这些数据集模拟了不同的细胞形态和运动特征。结果显示,该架构在不同数据集上都能取得一定的成绩,证明其具有适应性。不过,也发现不同数据集对训练数据的要求不同78。
- 数据需求分析:研究人员对训练数据需求展开研究,发现酵母细胞相对容易分割和追踪,少量训练数据就能达到较好效果。而合成数据集则各有挑战,所需训练数据量差异较大910。
研究结论和讨论部分指出,新架构在酵母细胞分割和追踪方面性能卓越,超越了其他对比工具。超参数分析为模型优化提供了指导,较短追踪范围适合稳定分割场景,较长追踪范围在分割有缺陷时更有利。合成数据集的评估展示了架构的通用性,但也强调了不同数据集的训练差异。该研究成果为细胞追踪领域带来了新的思路和方法,为后续研究细胞行为、探索生命奥秘奠定了坚实基础,有望推动生命科学和健康医学领域的进一步发展。