
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Transformer的胎儿头部超声标准切面预测:简化临床操作与提升图像质量的新方法
【字体: 大 中 小 】 时间:2025年06月13日 来源:Medical Image Analysis 10.7
编辑推荐:
为解决胎儿超声标准切面(SP)获取依赖操作者经验且耗时的问题,研究人员开发了基于Swin Transformer的视频到图像预测框架ScanAhead。该研究创新性地结合时空特征编码与探头运动推理,通过偏移适配器模块实现非标准切面到标准视图的域适应转换。实验证明,该方法在经脑室平面(TVP)和经小脑平面(TCP)预测中显著提升图像质量(FID降低30%),临床验证显示其预测误差(HC<6mm)满足生物测量要求,为实时超声引导提供了可行方案。
在产科超声检查中,获取胎儿头部标准切面(Standard Plane, SP)是评估胎儿发育的关键步骤。然而,这项操作高度依赖操作者的经验水平,且胎儿运动常导致图像质量不稳定。传统方法要么依赖人工识别特定解剖标志物,要么采用计算昂贵的物理模拟,均难以实现实时引导。更棘手的是,在探头接近标准切面的搜索过程中,视频帧往往存在运动模糊和结构缺失,与最终标准切面存在显著视觉差异。这些挑战使得临床实践中标准切面获取成为耗时且易出错的环节。
牛津大学医院NHS信托基金的研究团队在《Medical Image Analysis》发表的研究提出创新解决方案ScanAhead。该研究首次将视频到图像的预测范式引入超声领域,通过Transformer架构预测标准切面图像,显著提升了扫描效率。研究采用PULSE项目前瞻性采集的201例胎儿头部超声视频,创新性地结合了三种核心技术:Swin Transformer构建的层级空间自编码器捕捉多尺度解剖特征;时序卷积网络(TCN)建模探头运动轨迹;偏移适配器模块(offset adaptor)实现非标准帧到标准切面的知识迁移。通过双模态输入(视频+探头运动)和三级对齐损失(重建损失LRec
、纹理对齐LAlign
T
、保真度对齐LAlign
F
),系统能从未达标准的扫描视频中预测出符合临床要求的SP图像。
研究结果显示,在经脑室平面(TVP)预测中,SwinT2D+TCN架构的FID值降至187.11,较传统3D CNN提升43%。边缘检测显示预测图像能清晰呈现关键结构如透明隔腔(CSP)和头骨轮廓。引人注目的是,加入探头运动推理后,即使距离标准切面8秒的视频片段(Clip 1),其预测的头围(HC)误差仅5.21±3.2mm,满足临床测量要求。在经小脑平面(TCP)预测中,该方法将Fréchet SonoNet距离(FSD)降至6.04,显著优于对比方法。临床验证表明,使用预测引导可缩短约5秒扫描时间,妊娠年龄(GA)估计误差控制在3.5天(TVP)和10.4天(TCP)内。
这项研究的突破性在于:首次实现从非标准视频到标准切面的端到端预测;通过探头运动编码引入几何约束,增强了解剖细节的生成;验证了"近似标准切面"在生物测量中的可行性。该技术特别有助于初级超声医师快速定位标准切面,减少重复扫描。未来通过纳入异常病例数据,该系统有望扩展至胎儿畸形筛查领域,为智能超声导航树立了新标杆。
生物通微信公众号
知名企业招聘