基于场景图到图像扩散的可控手术模拟研究

【字体: 时间:2025年05月22日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3

编辑推荐:

  当前手术模拟工具缺乏真实感且依赖硬编码行为。为此,研究人员开展 SurGrID(场景图到图像扩散模型)研究,利用场景图(SG)实现可控手术场景合成。结果显示其提升了图像保真度与输入一致性,临床评估验证了真实性与可控性,为手术模拟提供新方向。

  
在医学领域,手术培训一直面临着伦理与安全的双重挑战。传统的 Halstedian 学徒模式依赖患者进行实操训练,不仅可能导致更高的并发症率,还引发了伦理争议。尽管结合模拟训练能缓解这些问题,但现有的虚拟现实模拟器基于计算机图形学,依赖人工定义渲染逻辑,难以复现人体解剖的复杂性和真实手术的细微差异,尤其在处理新术式或边缘情况时,需要手动编程,灵活性与真实感均显不足。

为突破这一困境,德国达姆施塔特工业大学(TU Darmstadt)等机构的研究人员开展了一项创新研究,相关成果发表在《International Journal of Computer Assisted Radiology and Surgery》。他们提出了 SurGrID(Scene Graph to Image Diffusion Model,场景图到图像扩散模型),旨在通过场景图(Scene Graphs, SGs)实现可控的手术场景合成,以提升模拟的真实感与交互性。研究表明,该模型能够有效利用场景图编码手术场景的空间和语义信息,通过去噪扩散模型生成高保真图像,并支持对生成内容的精准控制,为手术模拟领域开辟了新路径。

研究主要采用了以下关键技术方法:首先,利用手术视频的(图像、分割掩码、图)三元组数据,预训练两个图编码器 —— 局部信息编码器 EGloc 和全局信息编码器 EGglob。前者通过随机掩码物体并重构的方式捕捉解剖结构和工具的细粒度细节,后者则基于对比学习,将图嵌入与分割掩码嵌入对齐,以获取场景的整体布局和交互信息。其次,将这两个编码器的输出融合为条件信号,结合去噪扩散模型(Denoising Diffusion Models, DDMs)和无分类器引导(Classifier-Free Guidance, CFG)技术,实现基于场景图的图像合成。实验数据来自 CaDIS 数据集,包含 25 段白内障手术视频的 4670 帧,涵盖 17 类语义分割标签。

实验结果


定量图像分析


通过与 Sg2Im、LDM(CLIP 条件)、SGDiff 等基线方法对比,SurGrID 在图像质量和场景图一致性上表现显著。其弗雷歇 inception 距离(FID)为 26.6,核 inception 距离(KID)为 0.019,均低于基线,表明生成图像更接近真实样本。边界框交并比(BB IoU@0.5)达 0.549,F1 分数(F1@0.5)为 0.424,显示出对解剖结构和工具的位置、大小及类别的更高还原度。

消融研究


单独使用局部或全局信息时,模型性能显著下降(如仅局部信息的 FID 为 93.2),验证了两者结合的必要性。引导尺度 ω 的优化实验表明,当 ω=2.0 时综合性能最佳,过高或过低的 ω 值均会导致生成质量恶化。

定性结果与临床专家评估


视觉评估显示,SurGrID 能根据场景图修改精确调整图像内容,如工具位置移动、类型更换或移除等操作均能在生成图像中得到一致反映。三位具有至少两年经验的眼科医生参与的用户研究表明,生成图像的平均真实感评分达 5.82,与场景图修改的一致性评分达 5.70,证实了模型在临床场景中的实用性。

结论与讨论


SurGrID 首次将场景图与去噪扩散模型结合,实现了可控的手术场景模拟。其核心创新在于通过预训练图编码器有效捕捉手术场景的局部细节与全局结构,并利用扩散模型生成高保真图像。该方法突破了传统文本提示缺乏空间控制、掩码提示交互性不足的局限,为手术培训提供了一种可精确操控、高度真实的模拟工具。

研究结果不仅在定量指标上超越现有技术,更通过临床专家验证了其实际应用价值。未来,SurGrID 有望扩展至更多手术类型,并为个性化手术规划、新型器械测试等场景提供支持。这一成果标志着基于深度学习的手术模拟技术向临床实用化迈出了重要一步,为解决医学培训中的伦理与安全难题提供了创新解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号