基于生物物理模拟的图像驱动空间组学分析框架SiDoLa-NS实现神经系统多尺度分割与图谱映射
《npj Systems Biology and Applications》:Biophysical simulation enables segmentation and nervous system atlas mapping for image first spatial omics
【字体:
大
中
小
】
时间:2025年12月15日
来源:npj Systems Biology and Applications 3.5
编辑推荐:
本研究针对空间组学(SO)分析中组织分割依赖人工标注、跨尺度整合困难等挑战,开发了基于生物物理模拟的"模拟不标注"框架SiDoLa-NS。该技术通过生成合成训练数据,实现了小鼠大脑(mAP50=0.869)、脊髓(mAP50=0.96)和猪坐骨神经(mAP50=0.995)的多尺度自动分割,为神经系统研究提供了可扩展的拓扑分析方法。
在生物医学研究领域,空间组学(Spatial Omics, SO)技术的兴起带来了一场革命。这项技术能够同时获取组织切片中数千个基因的表达信息和空间位置,就像为生物学家提供了一幅详细的"分子地图"。然而,这幅地图的解读却面临巨大挑战——如何将分子数据与组织的复杂结构精确对应?特别是在大脑、脊髓等具有复杂管状结构的神经组织中,传统的图像分割方法往往力不从心。
当前的空间组学分析方法主要分为"自下而上"(bottom-up)和"自上而下"(top-down)两种策略。自下而上方法依赖于分子表达模式进行聚类分析,但难以准确对应到已知的解剖结构;而自上而下方法虽然能识别解剖区域,却严重依赖耗时费力的人工标注。更棘手的是,神经网络等先进方法需要大量标注数据训练,而人工标注不仅成本高昂,还容易引入主观偏差。这些问题严重限制了空间组学在神经科学等领域的广泛应用。
为解决这些挑战,由Lina Mohammed Ali、Aldrin Kay Yuen Yim、Emanuel Gerbi等研究人员组成的团队在《npj Systems Biology and Applications》上发表了他们的最新研究成果。他们开发了一种名为SiDoLa-NS(Simulate, Don't Label-Nervous System)的创新框架,通过生物物理模拟生成合成训练图像,完全摆脱了对人工标注的依赖。
研究团队采用了多项关键技术方法:利用Blender几何节点构建生物物理模拟管道,生成模拟不同尺度生物结构的合成图像;基于YOLO(You Only Look Once)框架开发实例分割卷积神经网络;使用艾伦脑图谱(Allen Brain Atlas)作为参考进行图谱映射;对小鼠脑、脊髓和猪坐骨神经等多组织多平台数据进行了系统性验证;整合空间转录组数据实现分子与形态学特征的关联分析。
研究人员首先展示了SiDoLa-NS在三个层次上的分析能力。在微观尺度,通过模拟不同细胞类型的核形态特征,训练出的SiDoLa-NS-Micro-CNS模型能够准确分割小鼠大脑切片中的细胞核,即使在细胞密度极高的区域也表现优异。在中观尺度,模型成功识别出大脑中的条纹状和层状结构,如海马齿状回和CA区。在宏观尺度,基于艾伦脑图谱训练的SiDoLa-NS-Macro-mCB模型能够精确划分大脑功能区,在验证集上达到了0.977的mAP50值。
在脊髓分析中,SiDoLa-NS-Macro-mSC模型成功识别了超过20个脊髓功能区,包括各种板层和白质区域。研究人员通过胆碱乙酰转移酶(ChAT)阳性细胞的分布验证了模型的准确性——腹角中ChAT阳性细胞比例(21%)显著高于背角(<1%),与已知生物学知识一致。模型对不同染色方法(如尼氏染色Nissl staining)和图像质量变化表现出强鲁棒性,即使在70%噪声混合情况下仍保持0.783以上的mAP50。
在猪坐骨神经分析中,SiDoLa-NS-Micro-PNS模型能够区分髓鞘化轴突和施万细胞核,而SiDoLa-NS-Meso-pSN模型则可自动识别神经束膜。定量分析显示,猪坐骨神经束平均包含约100个轴突和70个细胞核,与人工标注结果高度一致。这种分析能力对于研究如化疗引起的周围神经病变(CIPN)等疾病具有重要意义,因为不同功能类型的神经束可能受到选择性影响。
通过将SiDoLa-NS与空间转录组数据结合,研究人员发现了多个脑区和脊髓区域的标志基因。例如,在大脑中,Tshz2在压后区域特异性表达,Neurod6在海马区富集;在脊髓中,ChAT在板层7-10高表达,与运动输出功能一致,而Spag16在中央管周围表达,与脑脊液流动调节相关。这些发现证明了SiDoLa-NS在关联组织结构与分子功能方面的强大能力。
研究人员还将SiDoLa-NS应用于阿尔茨海默病(Alzheimer's disease)模型大脑的分析。结果显示,在CRND8转基因小鼠中,基底外侧杏仁核、齿状回颗粒细胞层等区域出现了与野生型小鼠相反的年龄相关细胞数量变化趋势。同时,模型在老年阿尔茨海默病模型大脑中的区域识别置信度降低,可能反映了与神经退行性病变相关的组织形态学改变。
此外,研究还发现,仅基于图像特征(如尼氏染色纹理)就能区分不同的脊髓功能区,表明形态学特征本身就包含丰富的生物学信息。
研究表明,SiDoLa-NS框架通过"模拟不标注"的创新策略,成功解决了空间组学分析中的多个关键问题。与生成对抗网络(GAN)或扩散模型不同,该方法的训练数据完全基于生物物理原理模拟生成,避免了递归生成崩溃问题,同时保证了训练数据的无限性和标注准确性。
这种方法的最大优势在于其通用性和可扩展性。通过调整模拟参数,可以轻松适应不同物种、组织类型和成像平台。此外,与自下而上方法的互补使用,可以充分发挥两种策略的各自优势——自上而下方法提供解剖学背景,而自下而上方法揭示分子异质性。
值得注意的是,SiDoLa-NS并非旨在取代现有的细胞分割工具,而是提供了一个更加全面的多尺度分析框架。从单个细胞到整个器官尺度,该工具能够无缝整合不同层次的空间信息,为理解复杂生物系统的组织原理提供了新途径。
尽管SiDoLa-NS表现出色,研究人员也指出了进一步优化的方向。例如,探索不同的神经网络架构(如UNet与实例分割模型的组合)可能会提升性能;同时,如何更好地处理边界模糊的组织区域也是未来研究的重点。
总之,SiDoLa-NS代表了一种新的空间组学分析范式,通过将生物物理模拟与深度学习相结合,为研究神经系统及其他复杂组织的结构与功能关系提供了强大工具。随着空间组学技术的快速发展,这种可扩展、可解释的分析框架将在生物医学研究中发挥越来越重要的作用,特别是在精准医疗和疾病机制研究领域。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号