StructSAM:面向CT影像肺癌病灶稳健分割的结构感知提示自适应框架

《npj Digital Medicine》:StructSAM: structure-aware prompt adaptation for robust lung cancer lesion segmentation in CT

【字体: 时间:2026年02月05日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对CT影像中肺癌病灶因低对比度、边界模糊及缺乏三维上下文导致的精准分割难题,提出了结构感知提示自适应框架StructSAM。该框架通过注入解剖先验、采用3D层间聚合器确保体积一致性,并利用PEFT提升可扩展性。在LIDC-IDRI数据集上实现了肺结节分割的最优性能,并在KiTS19和MSD Pancreas数据集的跨器官评估中展现出卓越的泛化能力,为基于基础模型的医学影像分割提供了稳健高效的解决方案。

  
在精准医疗时代,计算机断层扫描(Computed Tomography, CT)已成为肺癌诊断、分期和治疗规划不可或缺的工具。然而,CT影像中肺结节的精准分割始终是临床面临的重大挑战。这些病灶往往呈现低对比度、边界模糊等特性,加之传统的二维分割方法难以捕捉三维空间中的连续解剖结构,导致自动分割结果常出现漏诊或误分割。尽管自然图像分割领域的基础模型(Foundation Model)如Segment Anything Model (SAM)展现了强大性能,但其直接应用于医学影像时却严重"水土不服"——模型缺乏对解剖结构的先验知识,无法理解器官间的空间关系,对域偏移(Domain Shift)尤为敏感。
为突破这一瓶颈,研究人员在《npj Digital Medicine》上发表了StructSAM研究框架。该研究创新性地将解剖结构先验知识融入提示工程(Prompt Engineering),设计出专为医学影像定制的结构感知提示自适应机制。通过构建三维层间特征聚合器(3D Inter-slice Aggregator),模型能够同步分析连续切片间的空间关联性,确保分割结果的体积一致性。同时采用参数高效微调技术(Parameter-Efficient Fine-Tuning, PEFT)在保持模型泛化能力的前提下实现快速适配。
关键技术方法包括:1)基于解剖先验的提示自适应架构,将器官结构知识注入提示路径;2)三维卷积神经网络处理连续CT切片,建立层间特征关联;3)使用LIDC-IDRI、KiTS19和MSD Pancreas等多中心数据集进行验证;4)采用PEFT技术实现模型高效微调。
研究结果
结构先验增强的提示机制
通过对比实验发现,注入解剖先验的提示路径显著提升了模型对低对比度病灶的识别能力。在LIDC-IDRI数据集上,StructSAM对微小结节(直径<3mm)的分割精度达到92.3%,较原始SAM提升27.6%。
三维上下文建模
三维层间聚合器的引入有效解决了二维分割中的切片不一致问题。定量分析显示,该模块将体积重叠误差(Volumetric Overlap Error)降低至0.18,显著优于仅使用二维信息的基线模型(0.43)。
跨器官泛化性能
在KiTS19(肾脏肿瘤)和MSD Pancreas(胰腺分割)数据集上的交叉验证表明,StructSAM在不同器官的CT影像中均保持稳定性能。其Dice系数在肾脏分割任务中达到89.7%,在胰腺分割中为81.3%,证明其强大的域适应能力。
计算效率优化
PEFT技术的应用使模型仅需微调0.5%参数即可达到全参数微调的效果,训练时间减少至原来的1/8,为临床部署提供了可行性。
研究结论与讨论
StructSAM通过结构感知的提示自适应机制,成功解决了基础模型在医学影像分割中的三大核心问题:解剖结构理解不足、三维上下文缺失和域适应能力薄弱。该框架在保持模型通用性的同时,显著提升了在复杂医学影像场景下的分割精度和鲁棒性。特别值得注意的是,其在多器官数据集上的卓越表现预示着"一次训练,多方适配"的医疗AI发展新方向。这项研究不仅为医学影像分析提供了新的技术范式,更开创了将领域知识系统化嵌入基础模型的新路径,对推动可解释、可信赖的医疗AI发展具有里程碑意义。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号